Operaciones lógicas con conjuntos difusos. Principio de funcionamiento de NPE

Estas son algunas de las operaciones básicas que se pueden realizar en conjuntos difusos.

1. Suma conjunto difuso A está indicado por el símbolo y se define de la siguiente manera:

(5.15)

La operación de suma corresponde a la negación lógica. Por ejemplo, si A es el nombre del conjunto difuso, entonces "No un" se entiende como (ver ejemplo a continuación).

2. Asociación conjuntos difusos A Y EN denotado por A+B(o AÈB) y se determina :

(5.16)

Los partidos del sindicato conectivo lógico « o" Por ejemplo, si A Y EN– nombres de conjuntos difusos, luego la entrada “ A o B"se entiende como A+B.

tu más de .

Comentario: Hay que tener en cuenta que el conectivo lógico Ú V en este contexto significa por definición max (es decir); Ù significa mínimo (es decir).

3. Intersección A Y EN son designados AB y se define de la siguiente manera:

(5.17)

La intersección corresponde al conectivo lógico " tu", es decir. .

A y B=AÇB(5.18)

Al determinar el grado de pertenencia de elementos. tu nuevo conjunto difuso, elija menor de (ver nota arriba).

4. Producto A Y EN denotado por AB y está determinado por la fórmula

(5.19)

Si (5.20)

Ejemplo 5.5. Si

U=1+2+…+10

A=0,8/3+1/5+0,6/6 (5.21)

B=0,7/3+1/4+0,5/6,

Eso ØА=1/1+1/2+0,2/3+1/4+0,4/6+1/7+1/8+1/9+1/10

A+B=0,8/3+1/4+1/5+0,6/6

AÇB=0,7/3+0,5/6 (min se toma de dos valores de m)(5.22)

AB=0,56/3+0,3/6

0,4A=0,32/3+0,4/5+0,24/6

5. producto cartesiano conjuntos difusos Un 1,…, Un norte conjuntos universales U 1 ,…, Un norte denotado en consecuencia А 1 ´…´А n y se define como un subconjunto difuso del conjunto U 1 ´…´U n con función de membresía.

Ejemplo 5.6. Si

U 1 =U 2 =3+5+7

Un 1 =0,5/3+1/5+0,6/7

A 2 =1/3+0.6/5, entonces

A 1 ´A 2 =0,5/3,3+1/5,3+0,6/7,6+0,5/3,5+0,6/5,5+0,6/7,5

Relaciones difusas.

actitud confusa R: X®Y representa conjunto difuso producto cartesiano X´Y. R se describe a continuación utilizando la función de pertenencia de dos variables:

(5.25)

Una relación difusa en el conjunto X´Y es una colección de pares

(5.26)

Dónde - función pertenencia borrosa relación R, que tiene el mismo significado que la función de pertenencia de un conjunto difuso.

En absoluto norte- una relación aria es un subconjunto difuso del producto cartesiano X 1 ´X 2 ´…´X n, y

(5.27)

Ejemplos de relaciones difusas:

« X aproximadamente igual Y»,

« X mucho más grande Y»,

« A significativamente preferible EN».

Ejemplo 5.7. pretendamos que X=(Yuri, Serguéi), Y=(Máxima, Mijaíl).


Entonces la relación binaria difusa de “similitud” entre los elementos de los conjuntos X e Y se puede escribir en la forma

similitud=0,8/(Yuri, Maxim)+0,6/(Yuri, Mikhail)+0,2/(Sergei, Maxim)+0,9/(Sergei, Mikhail).

Además, Esta actitud se puede representar en la forma matrices de relaciones.

(5.28)

Donde (i,j)- elemento igual al valor funciones para i-ésimo valor X y valor j-ésimo y.

Si R- actitud X®Y(o, lo que es lo mismo, la relación en X´Y), A S- actitud Y®Z, entonces la composición R Y S es una relación difusa X®Z, denotado R°S y definido por la fórmula

donde ° es el signo de composición, signos Ú Y Ù denotar en consecuencia máximo Y mín., V yborde superior por rango de valores en.

Aquí (5.29) es composición de las relaciones.

La expresión (5.29) determina el producto maxmin R Y S.

Sí para numeros reales A Y b:

(5.30)

(5.31)

Si X,Y,Zconjuntos finitos, entonces la matriz de relaciones R°S es el producto maxmin de matrices de relaciones R Y S. En el producto maxmin de matrices, en lugar de la operación de suma y multiplicación, se utilizan las operaciones Ú Y Ù respectivamente.

Ejemplo de un producto maxmin

(5.32)

Aquí el número de filas debe ser igual al número de columnas. La fila se multiplica por la columna y se toma. valor máximo de valores mínimos vapor.

Lógica difusa y
Redes neuronales

El término "lógica difusa"

El término "lógica difusa"
En un sentido estricto,
la lógica difusa es cálculo lógico,
que es una extensión de la polisemántica
lógica.
En un amplio sentido
La lógica difusa es equivalente a la teoría difusa.
conjuntos.

Fundador

primer trimestre
lógica difusa
(lógica difusa) era
introducido
Americano
profesor
Lotfi Zadeh en 1965
año en el trabajo
"Difuso
conjuntos” en
revista
“Informática y
control".
Nacido en Bakú, Azerbaiyán como Lotfi.
Aleskerzadeh (o Asker Zadeh) del ruso
padres iraníes azerbaiyanos
origen; vivió en Irán desde 1932,
estudió en la Universidad de Teherán; desde 1944 hasta
Estados Unidos; trabaja en
Universidad de California, Berkeley).

Ejemplo

En febrero de 1991 hubo
el primero fue construido
<интеллектуальная>
lavadora, en
sistema de control del cual
lógica difusa combinada.
Detectando automáticamente
factores de entrada difusos:
volumen y calidad de la ropa,
nivel de contaminación,
tipo de polvo, etc.),
lavadora
eligió el óptimo
modo de lavado desde 3800
posible.

Reconocimiento de caracteres escritos a mano en ordenadores portátiles.
(cuadernos)
(Sony)
Control de lavadoras con un solo botón
(Matsushita, Hitatchi)
Reconocimiento de textos escritos a mano, objetos, voces.
(CSK, Hitachi, Universidad Hosai, Ricoh)
Gestionar el metro para mejorar la comodidad
conducción, precisión de parada y ahorro de energía (Hitachi)
Optimización del consumo de gasolina en los coches
(NO OK, herramientas Nippon Denki)
Sensibilidad y eficiencia de control mejoradas.
ascensores
(Fujitec, Hitachi, Toshiba)

Ejemplos de aplicación de lógica difusa:

Control automático de compuertas de presas en
centrales hidroeléctricas
Control de robot simplificado
Apuntar cámaras de televisión al retransmitir eventos deportivos
Control del vehículo eficiente y estable.
motores
Control de velocidad del coche económico
(Nissan, Subaru)
Planificación optimizada del horario de autobuses (Toshiba)
Sistemas de archivo de documentos.
(Mitsubishi eléctrico)
Sistemas de predicción de terremotos (Japón)
Diagnóstico de cáncer
(Escuela de Medicina de Kawasaki)

conjunto difuso

Las bases de la lógica difusa se sentaron a finales de los años 60 en
obras del famoso matemático estadounidense
Latfi Zadeh
Sea E un conjunto universal, x un elemento de E y R sea
una determinada propiedad.
Entonces el subconjunto difuso A del conjunto universal E
se define como el conjunto de un par ordenado
,
A(A(x)/x)
Hacha)
Dónde
función característica accesorios
(o simplemente una función de membresía) tomando
valor en algún conjunto ordenado M
(por ejemplo, M = ).
La función de membresía indica el grado (o nivel)
pertenencia del elemento x al subconjunto A.
18

Ejemplos de escritura de un conjunto difuso

Sea E=(x1, x2, x3, x4, x5), M=; A – elemento
conjunto para el cual
A (x1) 0,2 A (x2) 0 A (x3) 0,4 A (x4) 1 A (x5) 0,7
1)
2)
3)
Entonces A se puede representar como:
A=(0,2/x1;0/x2;0,4/x3;1/x4;0,7/x5),
A=(0,2/x1+0/x2+0,4/x3+1/x4+0,7/x5),
A =
x1
x2 x3
x4 x5
0,2
0
0,4
1
0,7

Ejemplo de conjunto difuso

Características básicas de los conjuntos difusos.

Sean M= y A un conjunto difuso con elementos de
conjunto universal E y el conjunto
accesorios m.
sup A(x)
Altura:
.
x mi
A(x)1
si sup
, entonces el conjunto difuso A es normal.
x mi
sup A (x) 1
Si xE
, entonces el conjunto difuso A
subnormal.
20

Un conjunto difuso está vacío si x E A (x) 0
Un conjunto subnormal no vacío puede ser
normalizar usando la fórmula: A (x) : A (x)
.
sup A(x)
x mi
Un conjunto difuso es unimodal si A (x) 1
sólo en una x de E.
El portador del conjunto difuso A es el habitual
subconjunto con propiedad A (x) 0, es decir A (x / x E, A (x) 0)
Elementos x E para los cuales A (x) 0,5,
se llaman puntos de transición del conjunto A.
-el subconjunto de nivel de A es un conjunto en
cual
Ejemplo:
“Varios”=0,5/3+0,8/4+1/5+1/6+0,8/7+0,5/8; su
características: altura=1, media =(3,4,5,6,7,8),
puntos de transición – (3,8).

Variable lingüística "Edad"

Enfrentémonos a la tarea de interpretar los significados del LP “edad”, como “joven”
edad, edad “avanzada” o edad “de transición”. Definamos “edad” como LP.
Entonces “joven”, “anciano”, “transicional” serán los significados de esta expresión lingüística.
variable. Un conjunto básico más completo de valores de “edad” de LP es el siguiente:
B = (bebé, niño, joven, joven, maduro, anciano, senil).
Para la “edad” de LP, la escala básica es una escala numérica de 0 a 120, que indica
número de años vividos, y la función de membresía determina la confianza que tenemos en
eso cantidad dada años pueden clasificarse en esta categoría de edad.
02:09
12

Características de los conjuntos difusos

Métodos para definir una función.
accesorios
Directo (encuestas de expertos)
Indirecto (comparaciones pareadas)
LR - funciones

Métodos para determinar la función de membresía.

LR borroso números

números difusos LR

.
Operaciones sobre conjuntos difusos
Operaciones lógicas
1. Encienda. Sean A y B conjuntos difusos en el universal
conjunto E. Entonces A está contenido en B si x E A (x) B (x)
Designación: A B
2. Igualdad. A y B son iguales si x E A (x) B (x) Notación: A=B
3. Adición. Sean M = , A y B son conjuntos difusos definidos en
E. A y B se complementan si x E A (x) 1 B (x)
Designación: B A
4. Intersección: el subconjunto difuso más grande que contiene
simultáneamente A y B (A B): A B (x) min(A (x), B (x))
5. Unión: el subconjunto difuso más pequeño.
incluyendo A y B, con función de membresía (A B):
A B (x) máx(A (x), B (x))
6. Diferencia – operación con función de membresía (A B A B):
A B (x) A B (x) mín(A (x), 1 B (x))
7. Suma disyuntiva – operación lógica con función
accesorios (A B (A B) (B A) (A B) (A B)):
A B (x) máx(mín(A (x), 1 B (x));mín(1 A (x), B (x)))

Operaciones sobre conjuntos difusos

Ejemplo
Sea A un intervalo difuso de 5 a 8 y B
número difuso alrededor de 4

Ejemplo

Intersección de conjunto difuso entre 5
y 8 Y (Y) alrededor de 4 (línea azul).

Union Fuzzy ambientada entre
5 y 8 O (O) alrededor de 4

Suma (negación) que significa NO

Concentración
Significado lingüístico de "muy"

Desenfocar (o difuminar)
Significado lingüístico
"No es bueno"

Fortalecimiento o debilitamiento
conceptos lingüísticos
Se logra el fortalecimiento o debilitamiento de los conceptos lingüísticos.
introducción de cuantificadores especiales. Por ejemplo, si
El concepto de “edad senil” se define como
entonces el concepto de “muy vejez” se definirá como
es decir, NM para “muy vejez” se verá así

Fortalecimiento o debilitamiento de conceptos lingüísticos.

Ejemplo

Ejemplo

Normas triangulares y
conormes
Norma triangular
Conorma triangular

Normas y conormas triangulares.

Operaciones algebraicas
1. El producto algebraico de A y B se denota
A B
y se define así:
x E A B (x) A (x) B (x)
2. suma algebraica de estos conjuntos se denota por A
B
y se define así:
x E A И B (x) A (x) B (x) A (x) B (x)
Con base en la operación del producto algebraico, se determina
la operación de elevar un conjunto difuso a la potencia α,
donde α –
A
numero positivo. conjunto difuso
determinado
función de membresía (x.)
A
A
Un caso especial de exponenciación es el siguiente.
3. Operación de concentración (compactación) CON (A) A2
4. Operación de estiramiento DIL(A) A
0.5
5. Multiplicación por un número. Si α es un número positivo tal que
max A (x) 1 , entonces el conjunto difuso αA tiene la función
xA
accesorios:
A (x) A (x)

Ejemplo de aplicación
normas triangulares y conorm

Un ejemplo de aplicación de normas triangulares y conormas.

borroso y
lingüístico
variables. Difuso
números
Lógica difusa y
Redes neuronales

Relaciones difusas.

Definición de borroso
cambiar

Ejemplo de relación difusa

Ejemplo: variable difusa
« alto crecimiento»
X - "alto crecimiento" (nombre
variable),
U = ,
- Función de la membresía
elementos del universo X dados
variable difusa.
Explicación: La variable difusa es un conjunto difuso con nombre

Ejemplo de representación 1

Definición de lingüístico
variable

Vista de ejemplo 2

Ejemplo: LP “temperatura ambiente”
β = “temperatura ambiente” es el nombre de la variable lingüística;
U = – universo de definición;
T = ("frío", "cómodo", "caliente") - conjunto de términos básicos;
GRAMO- reglas de sintaxis, generando nuevos términos usando
cuantificadores “y”, “o”, “no”, “muy”, “más o menos”;
M es un procedimiento que asigna cada nuevo término a
función de membresía (es decir, definir un conjunto difuso) de acuerdo con las reglas:
si los términos A y B tuvieran funciones de pertenencia μa(x) y μB(x)
En consecuencia, los nuevos términos tendrán funciones de membresía:
Cuantificador
Función de la membresía:
no t
muy t
más o menos t
AiV
máx(μA(x), μB(x))
A o B
mín(μA(x), μB(x))

Modelo de mercado-producto

Ejemplo: LP “disciplina”
β – disciplina;
T – (“Disciplina difícil”, “Interesante”
disciplina”, “Será útil en trabajos futuros”);
U = ["Programación", "Bases de datos",
“Lógica difusa”, “Historia”] – conjunto
disciplinas estudiadas por estudiantes de la dirección
"Informática de negocios";
G – procedimiento de enumeración de los elementos del conjunto térmico básico;
M – procedimiento de encuesta pericial.

Operaciones sobre relaciones difusas

Ejemplo: espesor de pieza
Deje que el experto determine el espesor del producto fabricado utilizando
los conceptos de “pequeño espesor”, “medio espesor” y “gran espesor”,
en este caso el espesor mínimo es de 10 mm y el máximo de 80 mm.
Esta descripción se puede formalizar utilizando
siguiente variable lingüística< β, T, X, G, M>, Dónde
β – espesor del producto;
T – (“pequeño espesor”, “espesor medio”, “espesor grande”);
U = ;
G – procedimiento para la formación de nuevos términos utilizando conectivos y, o y
modificadores como muy, no, ligeramente, etc. Por ejemplo: “pequeño o
espesor medio” (Fig. 24), “espesor muy pequeño”, etc.;
M – procedimiento para especificar subconjuntos difusos en X =
A1 = “espesor pequeño”, A2 = “espesor medio”, A3 = “espesor grande”
espesor", así como conjuntos difusos para términos de G(T) de acuerdo
con las reglas para traducir conectivos y modificadores difusos y, o no,
muy, ligeramente, etc.

Operaciones sobre relaciones difusas

Ejemplo: espesor de pieza
Funciones de membresía de conjuntos difusos:
“pequeño espesor” = A1, “espesor medio” = A2, “gran espesor” = A3
Función de la membresía
conjunto difuso “espesor pequeño o mediano” = A1 U A1

Un ejemplo de combinación de relaciones difusas.

tipos de drogas
LP
Disciplina
Velocidad
Jugador
equipos
Tamaño
Edad
Numérico
No numérico
Banco

Ejemplo de intersección de relaciones difusas.

Números difusos
Los números difusos son variables difusas definidas en eje numérico, es decir. difuso
El número se define como un conjunto difuso A en el conjunto R con la función
accesorios
Un número difuso es un subconjunto difuso del conjunto universal.
números reales, que tienen una función normal y convexa
accesorios, es decir, tales que:
a) hay un valor de soporte en el que la función de membresía es igual a uno,
y
b) al alejarse de su máximo hacia la izquierda o hacia la derecha, la función de membresía no
aumenta.
Ejemplo:
“Espesor” (T = (“pequeño espesor”, “espesor medio”, “espesor grande”))
Posibles valores según el dominio de definición de U: en en este caso valores
La variable lingüística “grosor del producto” se puede definir como
“unos 20 mm”, “unos 50 mm”, “unos 70 mm”, es decir, en forma de números difusos.

Ejemplos de canciones

Operaciones sobre difusas
números

Ejemplos de canciones

números difusos LR

Composición de dos relaciones difusas

números difusos LR

Selección de candidatos para la formación.

números difusos LR
Los números difusos tolerantes del tipo (L-R) se denominan trapezoidales.
números.
Si evaluamos un parámetro cualitativamente, por ejemplo diciendo: "Este valor
parámetro es promedio", debe ingresar una aclaración
una afirmación como "El promedio es aproximadamente de a a b"
que es un objeto evaluación de expertos(clasificación difusa), y
luego se puede utilizar para modelar clasificaciones difusas
números trapezoidales.
!!! Esto es lo más Manera natural clasificación incierta.
Los números difusos unimodales (L-R) se denominan triangulares.
números.
Los números triangulares formalizan declaraciones como "aproximadamente
es igual a α". Está claro que α+σ≈α, y como σ disminuye a cero, el grado
la confianza en la evaluación aumenta a uno.

Salida difusa
Lógica difusa y
Redes neuronales

Variables difusas y lingüísticas. Números difusos


yY
X
Difusor
una x
bloque difuso
lógico
producción
base difusa
normas
POR
Desfuzzificador

Definición de variable difusa


modelos
Los métodos lógico-lingüísticos para describir sistemas se basan en el hecho de que
el comportamiento del sistema en estudio se describe en términos naturales
(o cercano al natural) en términos de variables lingüísticas.
L1: Si y/o... y/o Eso y/o... y/o
L2: Si y/o... y/o Eso y/o... y/o
....................
lk: si y/o... y/o Eso y/o... y/o
Declaraciones difusas tipos 1 y 2

Ejemplo: variable difusa “alta”

Descripción lógico-lingüística de sistemas, difusa.
modelos
L1: si Eso
L2: si Eso


....................
lk: si Eso

Declaraciones difusas tipo 3
El conjunto de implicaciones (L1, L2, ..., Lk) refleja la funcionalidad
la relación entre las variables de entrada y salida es la base
construir una relación difusa XRY definida sobre el producto X x Y
conjuntos universales de variables de entrada y salida.
La relación R se construye como
l.
i
i

Definición de una variable lingüística


Variables lingüísticas
altura del jugador de baloncesto

Múltiples términos - (muy alto, alto, medio, bajo)
Técnica de juego del jugador de baloncesto.

Muchos términos - (excelente, muy bueno, bueno, regular, malo)
Confianza de unirse al equipo.
Muchas definiciones –
Muchos términos - (completo, mediano, pequeño, no tome)

Sistema “Reclutamiento de jugadores de baloncesto”
altura del jugador de baloncesto
Muchas definiciones –
Muy alto
promedio
alto
corto

Ejemplo: LP “disciplina”

Sistema “Reclutamiento de jugadores de baloncesto”
Técnica de juego del jugador de baloncesto.
Muchas definiciones –
excelente
muy bien
bien
promedio
malo

Ejemplo: espesor de pieza

Sistema “Reclutamiento de jugadores de baloncesto”
Confianza de unirse al equipo.
Muchas definiciones –
lleno
promedio
pequeño
no lo tomamos

Ejemplo: espesor de pieza

Sistema “Reclutamiento de Jugadores de Baloncesto” - Reglas
Variables lingüísticas de entrada
LP de salida
tecnica de juego
Altura del jugador
Confianza en la selección
Excelente
Muy alto
Lleno
Excelente
Alto
Lleno
Excelente
No muy alto
Promedio
Excelente
Corto
Promedio
Muy bien
Muy alto
Lleno
Muy bien
Alto
Lleno
Muy bien
No muy alto
Promedio
Muy bien
Corto
Promedio
Bien
Muy alto
Lleno
Bien
Alto
Lleno
Bien
No muy alto
Promedio
Bien
Corto
Pequeño
No muy bueno
Muy alto
Promedio
No muy bueno
Alto
Promedio
No muy bueno
No muy alto
Pequeño
No muy bueno
Corto
no lo tomamos
Gravemente
Muy alto
Pequeño
Gravemente
Alto
Pequeño
Gravemente
No muy alto
Pequeño

tipos de drogas

Circuitos de inferencia difusa
Esquema 1: algoritmo Mamdani. Implicación
se modela mediante un mínimo y la agregación mediante un máximo.
Esquema 2: algoritmo de Tsukamoto. Original
paquetes - como el algoritmo anterior, pero
Se supone que las funciones de membresía son
monótono.
Esquema 3. Algoritmo de Sugeno. Algoritmo
supone que los lados derechos de las reglas de inferencia
presentados como funciones lineales.
Esquema 4. Algoritmo de Larsen. En el algoritmo de Larsen
La implicación difusa se modela usando
operaciones de multiplicacion.
Esquema 5. Algoritmo de inferencia difusa simplificado.
Las reglas iniciales en este caso se dan en la forma:
Si X es Ai e Y es Bi, entonces z=Zi, donde Zi es un valor claro.

Números difusos

Algoritmo de Mamdani
Describa algún sistema mediante la siguiente
reglas difusas:
P1: si x es A, entonces w es D,
P2: si y es B, entonces w es E,
P3: si z es C, entonces w es F,
donde x, y, z son los nombres de las variables de entrada, w es el nombre
variable de salida, y se dan A, B, C, D, E, F
funciones de membresía (forma triangular).
Se supone que las variables de entrada han tomado
algunos valores específicos (claros): x0, y0, z0.
15

Operaciones con números difusos

Algoritmo de Mamdani
Etapa 1. Para valores dados y basados ​​en funciones de membresía A, B,
C, se encuentran los grados de verdad α(x0), α(y0), α(z0) para las premisas
cada una de las tres reglas dadas.
Etapa 2. Se produce la “corte” de las funciones de membresía de las conclusiones.
reglas (es decir, D, E, F) en los niveles α(x0), α(y0), α(z0).
Etapa 3. Se consideran las funciones truncadas en la segunda etapa.
accesorios y se combinan usando
operaciones máximas, lo que resulta en una combinación difusa
subconjunto descrito por la función de pertenencia μ∑(w) y
correspondiente a la inferencia para la variable de salida w.
Etapa 4 (si es necesario). Se encuentra el valor claro de la salida.
variable, por ejemplo, usando el método del centroide: borrar
el valor de la variable de salida se define como el centro de gravedad para
curva μ∑(w):
w0
w
(w)dw
(w)dw
16

números difusos LR

Algoritmo de Mamdani
w0
w
(w)dw
(w)dw
17

números difusos LR

Llevándolo a la claridad
(escalarización)

números difusos LR

Llevándolo a la claridad
(escalarización)

Salida difusa

algoritmo de larsen

Modelado difuso (lógico-lingüístico)

problema de control
aire acondicionado
Normas:

problema de control
aire acondicionado

Descripción lógico-lingüística de sistemas, modelos difusos.

problema de control
aire acondicionado

Sistema “Reclutamiento de jugadores de baloncesto”

El algoritmo de Tsukamoto.

Algoritmo de Sujeno y Thakazhi

Circuitos de inferencia difusa

Algoritmo de selección simplificado

Algoritmo de Mamdani

Algoritmo de selección simplificado

Algoritmo de Mamdani

¡Gracias por su atención!
¡¡¡Buena suerte!!!

Algoritmo de Mamdani

Neuronas y neurales.
redes
Lógica difusa y
Redes neuronales

Redes neuronales…
- capítulo inteligencia artificial, V.
que para el procesamiento de señales
fenómenos similares a
Ocurriendo en neuronas vivas.
criaturas
Aproximación
Previsión
Gestión de asociaciones
Identificación y evaluación
Clasificación y reconocimiento de patrones.
86

Aclaración (escalarización)

Tareas, con éxito
resuelto por redes neuronales
reconocimiento visual,
imágenes auditivas;
búsqueda asociativa
información y creación
modelos asociativos; síntesis
discursos; formación
lenguaje natural;
formación de modelos y
varios no lineales y difíciles
descrito matemáticamente
sistemas, previsión
desarrollo de estos sistemas en
tiempo:
uso industrial;
pronóstico de desarrollo
ciclones y otros naturales
procesos, previsión
cambios en los tipos de cambio y otros
procesos financieros;
sistemas de control y
regulación con
predicción; control
robots, otros complejos
dispositivos
varios finales
máquinas: sistemas de masas
servicio y conmutación,
telecomunicaciones
sistemas;
toma de decisiones y
diagnósticos que excluyen
inferencia lógica; especialmente en
zonas donde no hay
claro matemático
modelos: en medicina,
criminología, finanzas
esfera.
87

algoritmo de larsen

Áreas de conocimiento
88

Neurocomputadora…
- sistema de software y hardware (su
también se le puede llamar especializado
computadora), que implementa, o, como
dicen que proporciona algo
modelo formal de natural
red neuronal.
Programación de neurocomputadoras
no se lleva a cabo especificando una secuencia
comandos, sino presentando muestras, ejemplos
resolver problemas del área requerida
89

Problema en el control del aire acondicionado

40 años
años 50
años 60
condiciones previas
años 70
Nuevos conocimientos sobre el cerebro.
Desarrollo de la microelectrónica y
CT => base técnica
Imperfección
IIS existente
disminución debido a problemas técnicos
dificultades de implementación, desarrollo
programación simbólica
5000 especialistas,
> 100 empresas
Publicación de Hopfield:
Modelo Hebb ~ clase
sistemas fisicos
3)
1)
2)
Rosenblat y Windrow
creó un dispositivo perceptrón para
reconocimiento de patrones
concepto celular
Conjuntos de Hebb (Canadá)
primeros intentos de desarrollar IIS
basado en células nerviosas
Nivel de Interés
Historia de la neurocomputadora
años 80
Internacional
conferencia sobre
redes neuronales (Neural
Procesamiento de información
sistemas, etc),
especializado
revistas (Neural
redes,
Neurocomputadoras, etc.)
1996
producción y operación en serie
basado en red neuronal
tecnologías de sistemas de aplicación
años 90
siglo XXI
90

Alguna información sobre el cerebro.
Lo más difícil de sistemas conocidos procesamiento de información.
Contiene alrededor de 100 mil millones.
neuronas, cada una de las cuales tiene
en promedio 100 mil conexiones.
Fiable: funciona cuando se pierde
(muerte) de neuronas
Procesando grandes volúmenes
la información se realiza para acciones
segundos, a pesar de que el tiempo
varias reacciones neuronales
milisegundos
La estructura y funciones de las neuronas individuales están bien estudiadas.
Hay algunos datos sobre la organización de las actividades internas y externas.
Conexiones entre neuronas de algunas estructuras.
formaciones cerebrales
Poco se sabe sobre la participación varias estructuras en procesos
procesamiento de información.
91

neurona biológica
92

Impulso nervioso
- proceso de distribución
excitación a lo largo del axón desde el cuerpo
células (montículo axónico) para
terminaciones de axones.
- unidad básica de información,
transmitido por fibra.
...transmitido en ráfagas
potencial del ambiente intracelular
en relación con el entorno externo,
rodea la célula a una velocidad de
1 a 100 m/s.
Refractariedad: falta de excitabilidad de una célula nerviosa.
después de la emoción anterior.
Período refractario – intervalo de tiempo mínimo
entre los impulsos nerviosos(10-4.. 10-3 s)
93

El algoritmo de Tsukamoto.

Membrana
Proporciona
llevando a cabo
nervioso
impulsos por
fibra
Espesor
membranas
alrededor de 10 nanómetros
Medida de excitación celular = nivel de polarización
su membrana, dependiendo del total
cantidad de neurotransmisor (químico
sustancia) secretada en todas las sinapsis.
94

Elemento similar a una neurona (NPE)
o neurona formal
Modelo de una neurona física.
NPE consta de un sumador ponderado y
elemento no lineal. Operación
está determinado por las fórmulas:
Y
donde xi son señales de entrada, el conjunto de xi forma el vector X;
wi son coeficientes de peso, el conjunto de wi forma un vector de pesos W;
NET: suma ponderada de señales de entrada, el valor NET se transmite a
elemento no lineal;
Θ - nivel umbral de una neurona determinada;
F- función no lineal, llamada función de activación.
NPE tiene varias señales de entrada x y una señal de salida OUT.
Parámetros NPE: vector de pesos W, nivel umbral Θ y tipo de función
activación f.
95

Algoritmo de Sujeno y Thakazhi

Principio de funcionamiento de NPE
1. El NPE recibe un vector de entrada X, que representa
representan las señales de salida de otros NPE.
Esta señal de entrada corresponde a las señales que entran al
sinapsis de neuronas biológicas
2. Cada señal de entrada se multiplica por la correspondiente
el peso w1, w2, ... wn es un análogo de la eficiencia de la señal.
El peso es cantidad escalar, positivo para
excitadoras y negativas para las conexiones inhibidoras.
3. Ponderadas por las básculas de conexión, las señales de entrada llegan a
un bloque de suma correspondiente al cuerpo celular, donde
se realiza su suma algebraica y
Se determina el nivel de excitación del NPE.
4. La señal de salida de la neurona y está determinada por
pasando el nivel de excitación a través de la función de activación.
96

Algoritmo de selección simplificado

Tipos de funciones
activación F

Algoritmo de selección simplificado

Paso duro y
Duro
paso paso
departamento
Paso plano
+ sencillo;
+ la implementación requiere bajos costos;
-no permite simular circuitos
con señales continuas;
- El entrenamiento de redes neuronales es difícil.
+ fácil de calcular;
+ aprender es difícil.
98

Tangente hiperbólica
Función logística
y función de Fermi
(Función de Fermi)
Tangente hiperbólica
*se aplica a redes con
señales continuas;
+ entrenamiento fácil.
*se aplica para
perceptrones multicapa;
+ amplia gama de señales;
+ entrenamiento fácil.
99

Neuronas y redes neuronales.

Características especiales activación
Expositor
Función SOFTMAX (salidas de probabilidad)
Función lineal (no requerida
conexión en serie de capas
Curva gaussiana (respuesta NPE
debe ser máximo para
algún valor)
100

Redes neuronales…

Seleccionar una función de activación
determinado...
1. especificidad de la tarea.
2. facilidad de implementación en una computadora, en la forma
diagrama eléctrico u otros medios.
Tercero, algoritmo de aprendizaje: algunos
Los algoritmos imponen restricciones.
tipo de función de activación, son necesarios
considerar.
Muy a menudo, el tipo de no linealidad no tiene un efecto fundamental.
influencia en la solución del problema. Sin embargo buena elección Tal vez
reducir el tiempo de entrenamiento varias veces
101

Problemas resueltos con éxito por redes neuronales.

Limitaciones del modelo neuronal.
Cálculos de producción neuronal
se asumen
instantáneo, sin introducir
retrasos.
No incluido en el modelo.
los impulsos nerviosos.
Sin modulación de nivel
densidad de señal
impulsos, como en el nervioso
sistema.
No aparecen efectos
sincronización cuando
grupos de neuronas
procesar informacion
sincrónicamente, bajo control
ondas periódicas
excitación-inhibición.
No existen algoritmos claros para
selección de la función de activación.
No existen mecanismos para regular
el funcionamiento de la red en su conjunto (por ejemplo, regulación hormonal
actividad biológica
redes nerviosas).
Formalización excesiva
conceptos: "umbral", "peso
coeficientes".
No soportado
variedad de sinapsis.
Inhibitorio y excitador
las sinapsis se realizan en este
modelos en forma de pesas
coeficientes
signo opuesto, pero esto
no todos los tipos.
No visible en el modelo.
diferencia entre gradual
potenciales y nervios
impulsos.
102

Áreas de conocimiento

Red tipo neuro
- un conjunto de elementos similares a neuronas,
conectado de cierta manera
con un amigo y con el entorno externo.
Vector de entrada (que codifica el estímulo o imagen de entrada
entorno externo) se suministra a la red activando la entrada
Elementos similares a las neuronas.
Conjunto de señales de salida de redes neuronales y1, y2,..., yn
llamado vector de actividad de salida, o patrón
Actividad de la red neuronal.
103

Neurocomputadora…

Características de la arquitectura
Redes neuronales
topología de conexiones interneuronales;
selección de un subconjunto específico de NPE para
entrada y salida de información;
presencia o ausencia de competencia;
dirección y método de control y
sincronización de los flujos de información entre
neuronas
causa tipo específico llevado a cabo
red de transformación de la información
104

Historia de la neurocomputadora

neurales artificiales
redes
105

Alguna información sobre el cerebro.

Las propiedades más importantes
redes neuronales biológicas
Capacidad de procesamiento total
información: asociatividad
(la red puede restaurar
imagen completa de su parte),
capacidad de clasificar,
generalización, abstracción y
muchos otros.
Fiabilidad. NS biológico
tener fantástico
confiabilidad: falla
incluso el 10% de las neuronas en el sistema nervioso
el sistema no lo interrumpe
trabajar. Comparado con
computadoras en serie,
antecedentes basados ​​en principios
Neumann donde falla una celda
memoria o un nodo en
el equipo se estrella
sistemas.
Procesamiento en paralelo
información.
Autoorganización. En curso
trabajos biológicos NS
independientemente, bajo
influencia externa
entorno, aprende a resolver
diversas tareas.
Desconocido
restricciones fundamentales
sobre la complejidad de las tareas,
resuelto por biológico
Redes neuronales. Nervioso
el sistema mismo forma
algoritmos de su
actividades, aclaración y
complicándolos a lo largo de la vida.
Los NS biológicos son
sistemas analógicos
106

neurona biológica

Enfoques a la creación.
Redes neuronales
Enfoque informativo: no importa qué
mecanismos subyacen al funcionamiento de los artificiales.
redes neuronales, solo es importante que al resolver
tareas procesos de información estaban en la Asamblea Nacional
similares a los biológicos.
Enfoque biológico: a la hora de modelar es importante.
biosimilitud completa y se requieren detalles
Estudiar el funcionamiento de una neurona biológica.
Principales trabajos en investigación biológica.
Las redes neuronales pertenecen a Andrew Huxley, Alan.
Hodgkin, Bernard Katz, John Eccles, Stephen
Kuffler et al.
108

Impulso nervioso

Métodos de búsqueda
redes de tipo neuronal
Método
Peculiaridades
analítico
estudiar
- complejidad debido al gran número de NPE
+ interesante resultados analíticos recibió
para muchos modelos de redes neuronales
matemático
(imitación
modelado)
+ permite crear casi cualquier
modelos
- debido a la naturaleza secuencial de su trabajo
logra explorar modelos de limitada
tamaño
físico
modelado
+ le permite obtener rápidamente información confiable
resultados del modelo
- complejidad técnica de la implementación del hardware
un gran número de NPE con muchas
conexiones adaptativas
109

Membrana

Categorías de modelos
Redes neuronales
modelos de neurona única;
modelos de pequeños grupos de neuronas;
modelos de redes neuronales;
modelos actividad mental Y
el cerebro en su conjunto.
110

Elemento similar a una neurona (NLE) o neurona formal

Tipos de aprendizaje neuronal
redes
111

Principio de funcionamiento de NPE

Algoritmos de aprendizaje
con profesor
sin maestro
Dado
vector X,
señales de salida esperadas
neurona dj ∈ D
vector X
Selección
valores
señales de salida reales
la neurona debe aceptar
valores tanto como sea posible
cerca de lo esperado
la red aprende a ofrecer lo mejor
valores de salida. Qué
se entiende por "mejor"
- determinado por el algoritmo
capacitación.
Nuevo
valores
..debido a la capacidad de
Generalización por la red, si se aplica.
la entrada es un vector que no es
conoció durante el entrenamiento.
Siempre
112

Tipos de funciones de activación F

Métodos de formación de las PYME
Algoritmo inverso
propagación de errores
clásico
Degradado
Detección de gradiente
función objetiva
Algoritmo de métrica variable
Métodos heurísticos
Basado en experiencia personal
autor en el campo de la educación
Redes neuronales
Algoritmo de descenso más pronunciado
Algoritmo de conjugación de gradiente
Algoritmo de Levenberg-Marquardt
113

Paso rígido y paso plano.

Modelo de McCulloch-Pitts
Señal de salida:
Función de umbral:
Construcción modelo discreto justificado por la manifestación de la refracción
en las neuronas biológicas, lo que lleva al hecho de que la neurona puede
cambia su estado con una frecuencia finita, y la duración
Los períodos de inactividad dependen de la frecuencia de su funcionamiento.
114

Tangente hiperbólica y función de Fermi

Operaciones lógicas

Funciones de activación especiales

Algoritmo de entrenamiento de perceptrones
McCulloch-Pitts

Seleccionar una función de activación

Clasificación de neural
redes
Unidireccional
Recurrente
(con comentarios)
Método de combinación de neuronas.
Red neuronal
Número de capas de neuronas.
Una sola capa
Multicapa
118

Limitaciones del modelo neuronal.

Perceptrón simple
matriz de entrada binaria
(neuronas sensoriales o
"retina") r1, r2, ... rn, donde
se suministran imágenes de entrada;
conjunto similar a una neurona
elementos x1, x2, ... xm, s
conexiones fijas a
subconjuntos de retina
(“detectores de características”);
"elemento decisivo" - una NPE binaria con modificable
conexiones con "detectores". Generalmente el número de elementos decisivos
se elige igual al número de clases para las cuales
es necesario dividir las imágenes presentadas al perceptrón.
119

Red tipo neuro

Perceptrón Rosenblatt
Simple
a quien
condiciones:
perceptrón, para
justo
n=m y xi = ri,
en
este
detectores
señales
poder
tratado como entrada
capa.
El perceptrón de Rosenblatt tenía una capa de pesas entrenables,
cuyas entradas recibieron señales con d = 512
asociando neuronas con fijos aleatorios
pesos que forman un espacio de características para imágenes de 400 píxeles
120

Características de la arquitectura de la red neuronal.

Algoritmo de aprendizaje
perceptrón de Rosenblatt
Procedimiento de convergencia del perceptrón Rosenblatt
1. El vector de pesos wi se establece en arbitrario.
estado.
2. Las imágenes de la imagen de entrenamiento se envían alternativamente a la retina.
muestras que se transforman en la señal de salida y
elemento decisivo.
3.Si la respuesta es correcta, nada cambia.
4.Si la respuesta es incorrecta y=0, los pesos de todas las conexiones de
Los elementos activos de la retina aumentan, y con
respuesta incorrecta y=1 – disminuir en cantidad.
Si existe una solución, se alcanzará en
número finito de pasos en elección inicial conexiones.
121

Redes neuronales artificiales

Características del perceptrón
Tipo de señales de entrada: binaria o analógica (real).
Las dimensiones de entrada y salida están limitadas en la implementación del software.
sólo por las capacidades del sistema informático en el que
simulado red neuronal, con implementación de hardware y capacidades tecnológicas.
La capacidad de la red coincide con el número de neuronas.
Modificaciones. Los perceptrones multicapa permiten construir
superficies divisorias más complejas y por lo tanto tienen más
ampliamente utilizado en la resolución de problemas de reconocimiento.
Ventajas. Las implementaciones de software o hardware del modelo son muy
simple. Simple y algoritmo rápido capacitación.
Defectos. Superficies divisorias primitivas (hiperplanos)
dar la oportunidad de decidir solo lo más tareas simples reconocimiento
Áreas de uso. Reconocimiento de patrones, clasificación.

Las propiedades más importantes de las redes neuronales biológicas.

Perceptrón multicapa
red de distribución directa
Sensorial
(aporte)
capa
Día libre
(resultado) capa
Capas ocultas (asociativas)
El principio de comunicación entre neuronas es “cada una con cada una”.
El número de neuronas en capas puede ser arbitrario.
Normalmente, todas las capas ocultas tienen la misma cantidad de neuronas.
La capa de entrada solo distribuye las señales.
123

Diferencias entre redes neuronales biológicas y computadoras basadas en arquitectura von Neumann

Clasificación

Enfoques para la creación de redes neuronales.

Regresión (aproximación)

Métodos para estudiar redes de tipo neuronal.

Algoritmo para resolver problemas con
con la ayuda de las pymes
1.
2.
3.
4.
Determinar cuál es el significado
invertido en componentes
vector de entrada x. Aporte
el vector debe contener
condición formalizada
tareas, es decir toda la información
necesario para recibir
respuesta.
Seleccione el vector de salida y
de tal manera que
componentes contenidos completos
la respuesta a la tarea.
Seleccione el tipo de no linealidad en
neuronas (función de activación).
Establecer rango de cambio
entradas, salidas, escalas y
niveles de umbral, teniendo en cuenta
conjunto de valores del seleccionado
5. Asignar valores iniciales
coeficientes de peso y
niveles de umbral y
parámetros adicionales
(por ejemplo, la pendiente de la función
activación, si la hubiera
sintonizar durante el entrenamiento).
6. Realizar capacitación, es decir.
seleccione los parámetros de red para
para que el problema se solucione
la mejor manera. Por
Después de completar la capacitación, la red está lista.
resolver problemas del tipo que
ella está entrenada.
7. Aplicar condiciones a la entrada de la red.
problema como un vector x.
Calcule el vector de salida y,
que dará una forma formalizada
la solución del problema.
Funciones de activación.
126

Categorías de modelos de redes neuronales.

Algoritmo inverso
propagación de errores
Error de propagación hacia atrás
La base del método es función objetiva, formulado como
la suma cuadrática de las diferencias entre el valor real y el
valores esperados de las señales de salida.
En el caso de un solo
muestras (x,d) función objetivo
Se define como:
En grandes cantidades muestras de entrenamiento j (j = 1,2,.. p) objetivo
la función se convierte en una suma de todas las muestras:
127

Tipos de entrenamiento de redes neuronales

Etapas de ejecución del algoritmo.
propagación hacia atrás errores
1.Análisis neuronal
redes en vivo
dirección
transferencia de información
al generar
señales de entrada,
componentes
otro vector X.
2.Crea una red
contrarrestar
distribución
errores
3. Clarificación de escalas
4.Descrito en los párrafos 1, 2
y sigue 3 procesos
repetir para todos
muestras de entrenamiento.
.
A 1. Se calculan los valores del fin de semana.
Señales y salidas de neuronas de capa oculta.
capa, así como los correspondientes derivados
Funciones de activación de cada capa.
A 2.cambiando las direcciones de transmisión
señales, reemplazando sus funciones de activación
derivados y alimentación a la producción anterior
excitación en forma de diferencia entre
valor real y esperado. Para
la red así definida debe
calcular los valores de la inversa requerida
diferencias.
A 3. utilizar fórmulas basadas en los resultados,
obtenidos en los apartados 1 y 2, para la red original y
para una red de retropropagación
K 4. El algoritmo finaliza en este momento.
cuando la norma de gradiente cae por debajo de a priori
valor dado de la precisión del entrenamiento e.
128

Algoritmos de aprendizaje

Reentrenamiento de la red neuronal
Profesor de función,
generativo
educativo
ejemplos, norte<∞
Ud.
Red neuronal desde cero
error de aprendizaje
Problema: no es suficiente
información para
elige el único
solución correcta:
función docente.
una función seleccionada al azar da
malas predicciones usando nuevos ejemplos,
falta en el conjunto de entrenamiento, aunque
La última red reproducida sin errores.
En lugar de generalizar a partir de ejemplos conocidos,
la red los recordó
130

Métodos de formación de las PYME

Perceptrón multicapa
neuronas con fijo
grande).
escamas
Separación de datos
para educación y
validación
muchos ejemplos
reducir la diversidad
posibles configuraciones
redes neuronales entrenadas
con perdida minima
aproximandolos
habilidades
137

Perceptrón Rosenblatt

Red Hopfield
fin de semana
señales
neuronas
son ingresados ​​simultáneamente
señales
redes,
en
este
el vector emocionante no es particularmente
destaca.
No hay conexión entre la neurona y
propia salida
Señal de salida de la i-ésima neurona:
donde bi es el valor umbral,
especificado por una fuente externa,
N – número de neuronas.
138

Algoritmo de entrenamiento del perceptrón Rosenblatt

Resolver problemas usando
Redes de Hopfield
1. Construya la función de energía de tal manera que el punto
el mínimo global de esta función coincidió con la solución
tareas. En este caso, el gradiente de la función de energía debería
permitir el cálculo utilizando NN.
2. Escriba fórmulas para calcular los parámetros de la red (peso
coeficientes y niveles umbral) para calcular
gradiente de la función de energía.
3. Romper la cadena de retroalimentación y presentarlo en la red.
vector de entrada. Calcular los valores de salida.
4. Cerrar el círculo y potenciar la red
cambia tu estado de forma independiente (relajación).
Detener el proceso de relajación después de un día libre
el vector dejará de cambiar, es decir al alcanzar el mínimo
Funciones energéticas. Las salidas de red resultantes dan la solución.
tareas.
139

Características del perceptrón

Propiedades de lo moderno
Redes neuronales
Capacidad de aprendizaje. Al elegir uno de los modelos NN, crear una red y
Al ejecutar el algoritmo de aprendizaje, podemos entrenar la red.
resolviendo un problema que ella pueda manejar. No existen
garantiza que esto se puede hacer con la red seleccionada,
algoritmo y tarea, pero si todo se hace correctamente, entonces
la formación es exitosa.
Capacidad de generalizar. Después de entrenar la red.
Se vuelve insensible a los pequeños cambios.
señales de entrada (ruido o variaciones en los patrones de entrada)
y da la salida correcta.
La capacidad de abstraerse. Si presentas la red
varias variantes distorsionadas de la imagen de entrada, entonces la red
ella misma puede crear la imagen ideal al final, con
a quien nunca había conocido.
142

Perceptrón multicapa

Diferencia entre experto y NS
sistemas por la naturaleza del conocimiento
Sistemas expertos (ES)
Fuente Experiencia formalizada
conocimiento
experto, expresado como
declaraciones lógicas de reglas y hechos, ciertamente
recibido por el sistema
Carácter formal-lógico
conocimiento
conocimiento del “hemisferio izquierdo” en
forma de reglas
Desarrollo En forma de expansión
conocimiento
conjunto de reglas y hechos
(base de conocimientos)
Sistemas de redes neuronales (NN)
La experiencia combinada de un profesor experto,
seleccionando ejemplos para entrenamiento +
experiencia individual de un estudiante que estudia en estos
ejemplos de redes neuronales
Conocimiento asociativo del “hemisferio derecho” en
forma de conexiones entre neuronas de la red
En forma de formación adicional.
secuencia de ejemplos, con aclaración
Límites de categorías y formación de otras nuevas.
categorias
Role
Define reglas completas basadas en Selecciona ejemplos típicos, no
experto volumen de conocimiento experto
formular específicamente la justificación de su
sistemas
elección
Role
Búsqueda de una cadena de hechos y reglas Formación de experiencia individual en
art.syst. para probar una proposición
forma de categorías obtenidas sobre la base
ejemplos y categorización de imágenes

Inclusión. Sean A y B conjuntos difusos en el conjunto universal E. Se dice que A está contenido en B si "x ОE m A (x) > m B (x). Notación: A М B.

Igualdad. A y B son iguales si "xÎE m A (x) = m B (x). Notación: A = B.

Suma. Sean M = , A y B conjuntos difusos definidos en E. A y B se complementan si
"xÎE m A (x) = 1 – m B (x). Notación: B = o A = . Es obvio que . (El complemento está definido para M = , pero obviamente se puede definir para cualquier M ordenado).

Intersección. A Ç B – el subconjunto difuso más grande contenido simultáneamente en A y B;

metro AÇB(X) = mín(m A ( X), metro segundo ( X)}.

Union.A È B: el subconjunto difuso más pequeño, que incluye A y B, con una función de membresía

metro A È B(X) = máx ((m A ( X), metro segundo ( X)}.

Diferencia. A \ B= A Ç con función de membresía:

m A\B ( X) = mín ( m A ( X), 1 – metro segundo ( X)}.

Por ejemplo.

Sea: A = 0,4/ x 1 È 0,2/ x 2 È 0/ x 3 È 1/ x 4 ;


1. A М B, es decir A está contenido en B, C no es comparable ni a A ni a B.

2. A¹B¹C .

3. = 0,6/ x 1 È 0,8/ x 2 È 1/ x 3 È 0/ x 4 ;
= 0,3/ x 1 È 0,1/ x 2 È 0,9/ x 3 È 0/ x 4 .

Para conjuntos difusos, puede crear una representación visual. Consideremos un sistema de coordenadas rectangular, en cuyo eje de ordenadas los valores m A ( X), los elementos E están ubicados en el eje x en un orden arbitrario (ya hemos usado esta representación en ejemplos de conjuntos difusos). Si E está ordenado por naturaleza, entonces es deseable preservar este orden en la disposición de los elementos en el eje x. Esta representación aclara las operaciones simples en conjuntos difusos.

Arroz. 1. figura. 2

Arroz. 3. figura. 4.

En la Fig. 1, la parte oscura corresponde al conjunto difuso A y, para ser precisos, representa el rango de valores de A y todos los conjuntos difusos contenidos en A. En la Fig. Se dan 2 – 4, A Ç, AÈ, respectivamente.

Propiedades de las operaciones È y Ç.

Sean A, B, C conjuntos difusos, entonces se cumplen las siguientes relaciones:

A) – conmutatividad;

b) – asociatividad;

c) – idempotencia;

GRAMO) – distributividad;

e) AÈÆ = a, donde Æ – un conjunto vacío, es decir metro Æ (x) = 0"xÎE;

AÇE = A, donde E es el conjunto universal;

mi) - teorema de Morgan.

A diferencia de los conjuntos nítidos, para conjuntos difusos en el caso general AÇ Æ, AÈ ¹ E, que, en particular, se ilustra arriba en el ejemplo de una representación visual de conjuntos difusos.

Operaciones algebraicas en conjuntos difusos

El producto algebraico de A y B se denota A×B y se define de la siguiente manera:

"xÎE m A × B ( X) = m A ( X)m B ( X).

La suma algebraica de estos conjuntos se denota A + B y se define de la siguiente manera:

"xÎE m A+B ( X) = m A ( X) + metro segundo ( X)-m A ( X)m B ( X).

Para las operaciones (×, +) se satisfacen las siguientes propiedades:

· – conmutatividad;

· – asociatividad;

· A×Æ = Æ, A+Æ = A, A×E = A, A+E = E ;

· – Leyes de De Morgan.

No cumplido:

· – idempotencia;

· – distributividad;

· y también A× = Æ, A+ = E.

Demostremos la primera ley de De Morgan. Denotemos m A (x) por a, m B (x) por b. Luego en el lado izquierdo de la igualdad para cada elemento x tenemos: 1– ab, y en el derecho, según la fórmula de suma algebraica: (1– a) + (1– b) – (1 – a) (1 – segundo) = 1 – ab .

Demostremos que la primera propiedad de distributividad no se cumple, es decir A×(B + C) ¹ (A×B) + (A×C). Para el lado izquierdo tenemos: a(b+c antes de Cristo) = ab + ac – abc; para la derecha: ab + ac – (ab)(ac) = ab + ac + a 2 bc. Esto significa que la distributividad no se cumple para a¹a 2 .

Comentario. Cuando se utilizan las operaciones (È, Ç,+,×) juntas, se satisfacen las siguientes propiedades:

· A×(B È C) = (A×B) È (A × C);

· А× (B Ç C) = (A×B) Ç (A×C);

· A+(B È C) = (A+B) È (A+C);

· A+ (B Ç C) = (A+B) Ç (A+C).

Producto cartesiano de conjuntos difusos. Sean A 1, A 2, ..., An subconjuntos difusos de los conjuntos universales E 1, E 2, ..., En n, respectivamente. Producto cartesiano A = A 1 ´A 2 ´ ...´A n es un subconjunto difuso del conjunto E = E 1 ´E 2 ´ ... ´E n con función de membresía:

metro un ( X 1 ,X 1 , ...,X n) = mín( m A1 ( X 1), m A2 ( X 2) , ... , m Ai ( X norte) ).

Principio de generalización

El principio de generalización, una de las ideas principales de la teoría de conjuntos difusos, es de naturaleza heurística y se utiliza para ampliar el ámbito de aplicación de los conjuntos difusos a las asignaciones. Diremos que existe una función difusa f definida sobre el conjunto X con un valor en el conjunto Y si asigna a cada elemento xÎX un elemento yÎY con el grado de pertenencia m f (x,y). Una función difusa f define un mapeo difuso f : XY.

El principio de generalización es que para una f clara dada: X®Y o f difusa : Mapeo X Y para cualquier conjunto difuso A definido en X, se determina un conjunto difuso f(A) en Y, que es la imagen de A.

Sea f: X®Y una aplicación nítida dada, y A = (m A (x)/x) es un conjunto difuso en X. Entonces la imagen de A bajo la aplicación f es un conjunto difuso f(A) en Y con una función de membresía:

metro f(A) (y) = ; yÎY,

donde f –1 (y)=(x | f(x) = y).

En el caso de un mapeo difuso f : X Y, cuando para cualquier xОX e yОY se define la función de pertenencia de dos lugares m f (x, y), la imagen del conjunto difuso A definido en X es el conjunto difuso f( A) en Y con función de pertenencia m f (A) (y) = ( min(m A (x), m f (x, y) ).

PREGUNTAS Y TAREAS DEL EXAMEN

1. Sea: A = 0,4/ x 1 È 0,2/ x 2 È 0/ x 3 È 1/ x 4 ;

B = 0,7/ x 1 È 0,9/ x 2 È 0,1/ x 3 È1/ x 4 ;
C = 0,1/ x 1 È 1/ x 2 È 0,2/ x 3 È 0,9/ x 4 .

Conjuntos de constructos: a) AÇB;

taxi; LICENCIADO EN LETRAS.

2. Para el conjunto universal E = (Zaporozhets, Zhiguli, Mercedes, Ferrari), construya conjuntos difusos utilizando un método directo: a) “alta velocidad”;

b) “promedio”;

c) “de movimiento lento”.

3. Sea E = (1, 2, 3, ..., 100) y corresponda al concepto de “edad”. Usando el método directo para construir conjuntos difusos

a) “personas mayores”;

b) “es hora de casarse”;

c) “recluta”,

y construir una fórmula aproximada para las funciones de membresía correspondientes.

4. Bajo las condiciones de la tarea 2, construya conjuntos difusos a) – c) mediante un método indirecto basado en comparaciones por pares de elementos E.


CAPÍTULO 2. RELACIONES BINARIAS

Y FUNCIÓN DE SELECCIÓN

3) cualquier otro punto en la gráfica de una función que no sea c иx 0,5, por ejemplo, el límite aproximado del portador (x 0,01) o del núcleo (x 0,99); el valor del parámetro b se calcula a partir de los resultados.

3.Operaciones sobre conjuntos difusos

Hay dos grupos de operaciones sobre conjuntos difusos:

1) teoría de conjuntos operaciones , que representan una generalización de las operaciones de la teoría de conjuntos clásica al caso de conjuntos difusos;

2) operaciones que tienen en cuenta significativamente la borrosidad de la multiplicidad

propiedades que no tienen sentido para conjuntos ordinarios.

En general, las operaciones de la teoría de conjuntos en conjuntos difusos se definen de modo que, cuando se aplican a conjuntos nítidos, coincidan con las operaciones clásicas y ordinarias de la teoría de conjuntos.

De las operaciones del primer grupo, consideramos las operaciones de suma,

intersecciones, uniones y productos cartesianos , de las operaciones del segundo grupo - operación exponenciación.

3.1. Suma

Sea A un conjunto difuso en un conjunto X con una función de membresía μ A. El complemento de A es un conjunto difuso A con una función de membresía

(x )= 1− μ A (x ),x X

El operador complemento se utiliza normalmente para representar el modificador lógico "NO".

En la figura 2 se muestra un ejemplo de cómo realizar una operación de suma difusa. 3.1, de donde se desprende que existen elementos del dominio de definición que pertenecen tanto al conjunto mismo como a su complemento, mientras que estos elementos no pertenecen completamente a ninguno de estos conjuntos, con un grado de pertenencia igual a 1. En otras palabras, en la lógica difusa no se aplican el principio de no contradicción y la ley del tercero excluido, bien conocidos de la lógica clásica, lo que se debe precisamente a las fronteras poco claras entre el concepto y su negación.

Conceptos básicos de la teoría de conjuntos difusos

Arroz. 3.1. Un ejemplo de cómo realizar una operación de suma difusa

3.2. Intersección y Unión

Consideremos uno de los enfoques más comunes para definir las operaciones de intersección y unión de conjuntos difusos, a veces llamado enfoque minimax.

Sean A y B conjuntos difusos en el conjunto X con funciones de pertenencia μ A y μ B, respectivamente. Entonces la intersección A ∩ B y la unión A B de estos conjuntos son conjuntos difusos en X con funciones de membresía, respectivamente:

utilizando el enfoque minimax se muestran en la Fig. 3.2.

Arroz. 3.2. Ejemplos de realización de operaciones de intersección y unión de conjuntos difusos utilizando el enfoque minimax

La operación de intersección se usa generalmente para representar el conectivo lógico "Y", y la operación de unión se usa para representar el conectivo lógico "O".

Es fácil ver que si tomamos conjuntos claros y ordinarios como operandos A y B, entonces las operaciones de intersección y unión definidas de esta manera se reducen a sus análogos clásicos de la teoría de conjuntos. Además, las siguientes propiedades son válidas para estas operaciones:

Conceptos básicos de la teoría de conjuntos difusos

conmutatividad:

A ∩ B= B∩ A, A B= B A;

asociatividad:

(A∩ B) ∩ C= A∩ (B∩ C) ,

(A B) C= A(B C) ;

condiciones fronterizas:

Un ∩ =,

A = A,

A ∩ X= A,

AX = X;

idempotencia:

A ∩ A= A A= A;

distributividad:

A ∩ (B C) = (A ∩ B) (A ∩ C),

A (B∩ C) = (A B) ∩ (A C).

El enfoque considerado para definir las operaciones de intersección y unión difusas no es el único posible. Muy a menudo se utiliza un enfoque diferente, según el cual:

μ A ∩ B (x )= μ A (x )μ B (x ),x X ,

μ A B (x )= μ A (x )+ μ B (x )− μ A (x )μ B (x ),x X .

Este enfoque a veces se denomina probabilístico, ya que las expresiones correspondientes en su forma coinciden con expresiones para determinar las probabilidades de intersección y combinación de eventos aleatorios. En la figura 1 se muestran ejemplos de cómo realizar operaciones de intersección y unión usando un enfoque probabilístico. 3.3.

Arroz. 3.3. Ejemplos de realización de operaciones de intersección y unión de conjuntos difusos utilizando un enfoque probabilístico

Para las operaciones de intersección y unión, definidas mediante un enfoque probabilístico, las propiedades de conmutatividad y asociatividad, así como las condiciones de frontera, siguen siendo válidas.

Conceptos básicos de la teoría de conjuntos difusos

lovia. No se cumplen las propiedades de idempotencia y distributividad.

son válidos, pero sus análogos menos estrictos son válidos:

A ∩ A A, A A A;

A ∩ (B C) (A ∩ B) (A ∩ C),

A (B∩ C) (A B) ∩ (A C).

Los enfoques introducidos para definir las operaciones de intersección y unión difusas pueden considerarse como casos especiales de un enfoque generalizado basado en el uso de normas triangulares y conormas.

Sea una función de dos variables T (x,y) dada en el dominio × (es decir, en el cuadrado unitario), tomando valores en el segmento y satisfaciendo las siguientes condiciones (para todos los valores posibles x e y) :

1) conmutatividad: T(x, y) = T(y, x);

2) monotonicidad: x1 ≤ x2, y1 ≤ y2 T(x1, y1) ≤ T(x2, y2);

3) asociatividad: T(T(x, y), z) = T(x, T(y, z));

4) condición de contorno: T(x, 1) = T(1, x) = x.

De manera similar, sea dada una función S (x,y) sobre la misma área, tomando valores sobre el segmento y para todos los valores posibles de xey satisfaciendo las siguientes condiciones:

1) conmutatividad: S(x, y) = S(y, x);

2) monotonicidad: x1 ≤ x2, y1 ≤ y2 S(x1, y1) ≤ S(x2, y2);

3) asociatividad: S(S(x, y), z) = S(x, S(y, z));

4) condición de contorno: S(x, 0) = S(0, x) = x.

Entonces la función T (x,y) se llama norma triangular o

Norma T y S(x, y) – norma triangular o norma S.

Ejemplos de normas T y normas S son:

TM (x,y) = mín(x,y);

S M (x,y) = máx(x,y);

T P (x,y) =xy;

S P (x,y) = x +y –xy;

T L (x,y) = máx(x +y –1, 0);

S L (x,y) = mín(x +y, 1).

Utilizando las normas T y S, podemos introducir la siguiente definición generalizada de las operaciones de intersección y unión de conjuntos difusos:

μ A ∩ B (x )= T (μ A (x ),μ B (x )),x X ,

μ A B (x )= S (μ A (x ),μ B (x )),x X .

donde T es alguna norma T, S es alguna norma S.

Producto algebraico A Y B denotado por AB y se define así:

xE  AB ( X) = A ( X) B ( X).

suma algebraica de estos conjuntos se denota y define de la siguiente manera:

xE =  A ( X) +  B ( X) A ( X) B ( X).

Para las operaciones (, ) se satisfacen las siguientes propiedades:

- conmutatividad;

- asociatividad;

A = , A  = A, AE = A, A E = E

- Teorema de De Morgan.

No cumplido:

Idempotencia;

- distributividad;

y también A = , A = E.

Comentario. Dejamos al lector las pruebas de las propiedades dadas de las operaciones con conjuntos difusos.

Por ejemplo, demostremos la propiedad: . denotemos A ( X) a través de a ,  B ( X) a través de b . Luego en el lado izquierdo para cada elemento. X tenemos: 1- ab , y a la derecha: (1- a )+(1-b )-(1-a )(1-b ) = 1-a +1-b- 1+a +b-ab = 1-ab . 

Demostremos que la propiedad de distributividad no se cumple, es decir A(B C)  (AB) (AC). Para el lado izquierdo tenemos: a (b +c-bc ) = ab +ac-abc ; por la derecha: ab +C.A -(ab )(C.A ) = ab +C.A +a 2 antes de Cristo . Esto significa que la distributividad no se cumple para aa 2 . 

Comentario. Cuando las operaciones (, ,,) se utilizan juntas, se satisfacen las siguientes propiedades:

A(BC) = (AB)(A  C);

A (BC) = (AB)(AC);

A (BC) = (A B)(A C);

A (BC)=(A B)(A C).

Continuaremos nuestra revisión de las operaciones básicas en conjuntos difusos.

Basado en la operación del producto algebraico (al menos para números enteros) esta base es obvia) la operación se determina exponenciación conjunto difuso A, Dónde - numero positivo. conjunto difuso A determinado por la función de membresía  A  =   A (x). Un caso especial de exponenciación es:

CON(A) = A2- operación concentración,

DIL(A) = A 0,5- operación esguinces,

que se utilizan cuando se trabaja con incertidumbres lingüísticas.

Multiplicar por un número. Si - un número positivo tal que   A ( X) 1, luego el conjunto difuso A tiene una función de membresía:

A( X) = A( X).

Combinación convexa de conjuntos difusos. Dejar A 1 , A 2 ,.., A n - conjuntos difusos del conjunto universal mi, A  1 ,  2 , ...,  norte- números no negativos cuya suma es igual a 1.

combinación convexa A 1 , A 2 ,.., A n se llama conjunto difuso A con función de membresía:

xEA ( X 1 , X 1 ,..., X norte) =  1  A1 ( X) +  2  A2 ( X) + ... +  norte  Ai ( X).



Producto cartesiano de conjuntos difusos. Dejar A 1 , A 2 , ..., A n - subconjuntos difusos de conjuntos universales mi 1 , mi 2 , ..., mi norte respectivamente. producto cartesiano Una = Una 1 A 2  ...  A n es un subconjunto difuso del conjunto mi = mi 1 mi 2 ... mi n con función de membresía:

A ( X 1 ,X 1 , ...,X n) = mín(  A1 ( X 1),  A2 ( X 2) , ... ,  Ai ( X norte) ).

Operador creciente difuso se utiliza para convertir conjuntos nítidos en conjuntos difusos y para aumentar la borrosidad de un conjunto difuso.

Dejar A- conjunto difuso, mi- conjunto universal para todos xE se definen conjuntos difusos K( X) . La totalidad de todos K( X) llamado núcleo del operador creciente difuso F. El resultado de la acción del operador. F a un conjunto difuso A es un conjunto difuso de la forma:

Ф(A, K) =  A ( X)K( X),

Dónde A ( X)K( X) - el producto de un número y un conjunto difuso.

Ejemplo:

mi = {1,2,3,4};

A = 0,8/1+0,6/2+0/3+0/4;

k(1) = 1/1+0,4/2;

k(2) = 1/2+0,4/1+0,4/3;

k(3) = 1/3+0,5/4;

k(4) = 1/4.

Ф(A,K) = A(1) k(1) A(2)k(2) A(3)k(3)A(4)k(4) =

0,8(1/1+0,4/2)  0,6(1/2+0,4/1+0,4/3) =

0,8/1+0,6/2+0,24/3.

Conjunto nítido de nivel  (o nivel ) . El conjunto de nivel  de un conjunto difuso A conjunto universal mi llamado claro subconjunto A juego universal mi, definido como:

A ={X / A(X )), donde 1.

Ejemplo: A= 0,2/x 1 + 0/x 2 + 0,5/x 3 + 1/x 4 ,

Entonces Un 0,3 = {X 3 ,X 4 },

Un 0,7 = {X 4 }.

Una propiedad bastante obvia: si  1  2, entonces A 1  A 2 .

Teorema de descomposición. Cualquier conjunto difuso A se puede descomponer en sus conjuntos de niveles en la forma:

A = A , Dónde A - producto de un número para muchos A, Y "recorre" el rango de valores METRO funciones de membresía de conjuntos difusos A.

Ejemplo:A = 0,1/X 1 + 0/X 2 + 0,7/X 3 + 1/X 4 se puede representar como:

A = 0,1(1,0,1,1)  0,7(0,0,1,1,)  1(0,0,0,1)=

= (0,1/x 1 + 0/x 2 + 0,1/x 3 + 0,1/x 4) (0/x 1 + 0/x 2 + 0,7/x 3 + 0,7 /x 4)

(0/x 1 + 0/x 2 + 0/x 3 + 1/x 4) = 0,1/x 1 +0/x 2 +0,7/x 3 +1/x 4.

Si el dominio de la función de membresía consta de norte gradaciones  1   2   3  ...  n , entonces A(con valores fijos de gradaciones) se puede representar como:

A = i Ayo,

aquellos. está determinado por una colección de conjuntos ordinarios ( A 1 , A 2 , ..., Ai ), donde A1  A2  , ...,  Ai.

7. Variables lingüísticas. Ejemplos de variables lingüísticas. El concepto de terma. Determinar el número de términos

Variable lingüística- en teoría de conjuntos difusos, una variable que puede tomar el significado de frases de un lenguaje natural o artificial. Por ejemplo, la variable lingüística “velocidad” puede tener los valores “alta”, “media”, “muy baja”, etc. Las frases cuyo valor toma la variable son, a su vez, nombres de variables difusas y se describen mediante un conjunto difuso.

Ejemplo: edad difusa

Considere una variable lingüística que describe la edad de una persona, entonces:

x: "edad";

X: conjunto de números enteros del intervalo ;

T(x): significa “joven”, “maduro”, “viejo”. establecer T(x) - un conjunto de variables difusas, para cada valor: “joven”, “maduro”, “viejo”, es necesario establecer una función de membresía, que especifica información sobre la edad a la que las personas deben considerarse jóvenes, maduras , viejo;

G: “mucho”, “no mucho”. Tales adiciones permiten la formación de nuevos significados: “muy joven”, “no muy viejo”, etc.

M: una regla matemática que determina el tipo de función de pertenencia para cada valor formado usando la regla G.

Término- una expresión de un lenguaje formal (sistema), es el nombre formal de un objeto o el nombre de una forma. Concepto terma determinado inductivamente. Un término es una expresión simbólica: t(X1, X2,…, Xn), donde t es el nombre del término, llamado funtor o “letra funcional”, y X1, X2,…, Xn son términos, estructurados o simples. .

8. Relaciones difusas y sus propiedades.

Uno de los conceptos básicos de la teoría de conjuntos difusos es el concepto de relación difusa. Estas relaciones nos permiten formalizar afirmaciones imprecisas como "casi igual a" o "mucho más que". Demos una definición de relación difusa y una combinación de relaciones difusas.

A una relación difusa entre dos conjuntos no vacíos (nítidos) la llamaremos conjunto difuso definido sobre un producto cartesiano.

La inferencia difusa es el proceso de obtener conclusiones difusas basadas en condiciones o premisas difusas.

En relación con un sistema de control de objetos difusos, la inferencia lógica difusa es el proceso de obtener conclusiones difusas sobre el control requerido de un objeto basándose en condiciones o premisas difusas, que representan información sobre el estado actual del objeto.

La inferencia lógica se lleva a cabo en etapas.

La borrosidad (introducción de la borrosidad) es el establecimiento de una correspondencia entre el valor numérico de la variable de entrada de un sistema de inferencia difuso y el valor de la función de pertenencia del término correspondiente de la variable lingüística. En la etapa de fusificación, los valores de todas las variables de entrada del sistema de inferencia difusa, obtenidos de forma externa al sistema de inferencia difusa, por ejemplo, utilizando datos estadísticos, se asignan a valores específicos de las funciones de pertenencia del sistema de inferencia difusa. términos lingüísticos correspondientes, que se utilizan en las condiciones (antecedentes) de los núcleos de reglas de producción difusas, formando la base de las reglas de producción difusas del sistema de inferencia difusa. La fusificación se considera completada si se encuentran los grados de verdad (a) de todos los enunciados lógicos elementales de la forma "IS", incluidos en los antecedentes de las reglas de producción difusas, donde es un determinado término con una función de pertenencia conocida µ(x), es un valor numérico claro perteneciente al universo de una variable lingüística.

El concepto de algoritmo difuso, introducido por primera vez por L.A. Zadeh es una herramienta importante para el análisis aproximado de sistemas complejos y procesos de toma de decisiones. Se entiende por algoritmo difuso un conjunto ordenado de instrucciones (reglas) difusas, cuya formulación contiene instrucciones (términos) difusos.

La transición del conjunto difuso resultante a un único valor claro ()o, que luego se reconoce como una solución al problema, se llama defusificación.

11. El algoritmo de Mamdani encontró aplicación en los primeros sistemas de control automático difusos. Fue propuesto en 1975 por el matemático inglés E. Mamdani para controlar una máquina de vapor.

La formación de la base de reglas del sistema de inferencia difusa se lleva a cabo en forma de una lista ordenada y acordada de reglas de producción difusas en la forma “SI A ENTONCES B”, donde los antecedentes de los núcleos de las reglas de producción difusas se construyen utilizando los conectivos lógicos “Y”, y las consecuentes de los núcleos de las reglas de producción difusas son simples.

La difusificación de las variables de entrada se lleva a cabo de la manera descrita anteriormente, tal como en el caso general de la construcción de un sistema de inferencia difuso.

La agregación de subcondiciones de reglas de producción difusas se lleva a cabo utilizando la operación lógica difusa clásica "Y" de dos declaraciones elementales A, B: T(A ∩ B) = min( T(A);T(B) ) .

La activación de subconclusiones de reglas de producción difusas se lleva a cabo mediante el método de activación mínima μ (y) = min(c; μ (x) ) , donde μ (x) y c son, respectivamente, las funciones de pertenencia de términos de variables lingüísticas y el grado de verdad de enunciados difusos que forman los correspondientes núcleos de consecuencias (consecuentes) de reglas de producción difusas.

La acumulación de subconclusiones de reglas de producción difusas se lleva a cabo utilizando la lógica difusa clásica unión máxima de funciones de membresía ∀ x ∈ X μ A B x = max( μ A x ; μ B x ) .

La defusificación se lleva a cabo mediante el método del centro de gravedad o del centro de área.

12 Para implementar sistemas basados ​​en reglas difusas, se han desarrollado muchos algoritmos de inferencia difusa. Los algoritmos de inferencia difusa se diferencian principalmente en el tipo de reglas utilizadas, operaciones lógicas y el tipo de método de defusificación. Se han desarrollado modelos de inferencia difusa de Mamdani, Sugeno, Larsen y Tsukamoto.

Por ejemplo, las reglas de inferencia difusa se dan de la siguiente manera:

P1: si x es A, entonces w es D, P2: si y es B, entonces w es E, P3: si z es C, entonces w es F,

donde x, y, z – nombres de las variables de entrada (formato claro);

w – nombre de la variable de salida;

A, B, C, D, E, F: funciones de membresía dadas.

Teorema FAT B. Kosko: Cualquier matemática clásica se puede aproximar mediante matemáticas difusas. Aquellos. Es posible construir un sistema difuso que se aproxime lo más posible a la función de fluctuación del tipo de cambio de una determinada moneda.

Las principales ventajas del sistema de explicaciones en ES.

1) Las explicaciones ayudan al usuario a utilizar el sistema para resolver sus problemas,

2) Dado que los EE se utilizan en áreas poco formalizadas donde no existen algoritmos claros, las explicaciones permiten al usuario estar convencido de la exactitud de los resultados obtenidos y aumentar su grado de confianza en los EE.

3) Servir para la formación de usuarios,

4) Sirve para depurar la base de conocimientos de ES.

Las principales desventajas del sistema de explicaciones en ES.

1) Las solicitudes de explicación se interpretan solo en un sentido estricto (las preguntas POR QUÉ y CÓMO se interpretan solo en términos de objetivos y reglas),

2) No todas las acciones del sistema se pueden explicar (por ejemplo, por qué se probó primero una hipótesis y luego otra),

3) Las explicaciones en realidad se basan en la pista de ejecución del programa, por lo que al cambiar el intérprete, es necesario cambiar el sistema de explicación.

La cuidadosa consideración y consideración de los riesgos se ha convertido en una parte integral y un componente importante del éxito de cada empresa. Sin embargo, cada vez más, las empresas deben tomar decisiones en condiciones de incertidumbre, lo que puede tener consecuencias imprevistas y, en consecuencia, resultados y pérdidas indeseables. Las decisiones incorrectas en materia de inversiones a largo plazo, que suelen estar implícitas en la evaluación de proyectos de inversión, pueden tener consecuencias especialmente graves. Por lo tanto, la identificación oportuna, así como la evaluación de riesgos adecuada y más precisa, es uno de los problemas acuciantes del análisis de inversiones moderno.

Desafortunadamente, los métodos actuales de contabilidad y evaluación de riesgos no están exentos de subjetividad y de importantes requisitos previos, lo que lleva a evaluaciones incorrectas del riesgo del proyecto. La teoría de la lógica difusa es un enfoque nuevo y en desarrollo dinámico para la evaluación de riesgos. Recientemente, el modelado difuso ha sido una de las áreas más activas y prometedoras de la investigación aplicada en el campo de la gestión y la toma de decisiones.

Este trabajo presenta:

Definición de riesgo e incertidumbre,

justificación de la necesidad de utilizar nuevos enfoques para el análisis de riesgos,

una breve descripción del método de lógica difusa,

ejemplos de aplicación de lógica difusa

Los problemas que resuelven las redes neuronales son muy diversos. No es sorprendente que este método haya encontrado aplicación en campos como la medicina, la gestión financiera y las ciencias políticas. En general, podemos reducir la mayor parte de los problemas resueltos utilizando RNA a varias categorías de problemas.

Clasificación. La tarea de una red neuronal es distribuir objetos en varias clases preestablecidas que no se superponen.

En ciencias políticas, el método de las redes neuronales se utiliza para resolver problemas de clasificación, en particular en el análisis de eventos. La clase de secuencias de eventos de conflicto que conducen a una solución pacífica y la clase de secuencias de eventos de conflicto que conducen a una confrontación militar se determinan de antemano.

Una neurona artificial (neurona matemática de McCulloch-Pitts, neurona formal) es un nodo de una red neuronal artificial, que es un modelo simplificado de una neurona natural. Matemáticamente, una neurona artificial generalmente se representa como una función no lineal de un solo argumento: una combinación lineal de todas las señales de entrada. Esta función se llama función de activación o función de activación, función de transferencia. El resultado resultante se envía a una única salida. Estas neuronas artificiales se combinan en redes: conectan las salidas de algunas neuronas con las entradas de otras. Las neuronas y redes artificiales son los elementos principales de una neurocomputadora ideal

18. Función de activación (función de activación, función de excitación): función que calcula la señal de salida de una neurona artificial. Como argumento toma la señal Y recibida en la salida del sumador de entrada Sigma. Las funciones de activación más utilizadas son:

1. Función de salto único o umbral estricto

Una función lineal simple por partes. Si el valor de entrada es menor que el umbral, entonces el valor de la función de activación es igual al mínimo permitido; en caso contrario, es igual al máximo permitido.

Función de activación. Función de umbral estricto

2. Umbral lineal o histéresis

Una función lineal simple por partes. Tiene dos secciones lineales donde la función de activación es idénticamente igual a los valores mínimo permitido y máximo permitido y hay una sección donde la función aumenta de manera estrictamente monótona.

Función de activación. Umbral lineal

3. Función sigmoidea o sigmoidea

Función no lineal en forma de S diferenciable que aumenta monótonamente en todas partes con saturación. Sigmoide le permite amplificar señales débiles y no saturarse con señales fuertes. Grossberg (1973) encontró que dicha función de activación no lineal resolvía su dilema de saturación de ruido.

Una red neuronal artificial (RNA) es un modelo matemático, así como su implementación de software o hardware, construido sobre el principio de organización y funcionamiento de redes neuronales biológicas: redes de células nerviosas de un organismo vivo. Este concepto surgió al estudiar los procesos que ocurren en el cerebro y al intentar modelarlos. El primer intento de este tipo fueron las redes neuronales de W. McCulloch y W. Pitts. Tras el desarrollo de los algoritmos de aprendizaje, los modelos resultantes comenzaron a utilizarse con fines prácticos: en problemas de previsión, para reconocimiento de patrones, en problemas de control, etc.

ANN (Artificial Neural Network) puede considerarse como un gráfico dirigido con conexiones ponderadas, en el que las neuronas artificiales son nodos. Según la arquitectura de las conexiones, las RNA se pueden agrupar en dos clases: redes de retroalimentación, en las que los gráficos no tienen bucles, y redes recurrentes o redes con conexiones de retroalimentación. En la familia más común de redes de primera clase, llamadas perceptrones multicapa, las neuronas están dispuestas en capas y tienen conexiones unidireccionales entre capas. La figura muestra redes típicas de cada clase. Las redes feedforward son estáticas en el sentido de que, para una entrada determinada, producen un conjunto de valores de salida que son independientes del estado anterior de la red. Las redes recurrentes son dinámicas, ya que debido a la retroalimentación en ellas se modifican las entradas de las neuronas, lo que conduce a un cambio en el estado de la red. 22

23. perceptrón: un modelo matemático del proceso de percepción (ver Percepción). Ante nuevos fenómenos u objetos, una persona los reconoce, es decir, los relaciona con tal o cual concepto (clase). Así, reconocemos fácilmente a nuestros conocidos, aunque hayan cambiado de peinado o de ropa, podemos leer manuscritos, aunque cada letra tiene sus propias características, reconocemos una melodía en una disposición diferente, etc. Esta capacidad humana se llama fenómeno de percepción. Una persona puede, basándose en la experiencia, desarrollar nuevos conceptos y aprender un nuevo sistema de clasificación. Por ejemplo, al aprender a distinguir signos escritos a mano, al alumno se le muestran signos escritos a mano y se le dice a qué letras corresponden, es decir, a qué clases pertenecen estos signos; Como resultado, desarrolla la capacidad de clasificar correctamente los signos.

Cada célula individual se llama nodo o perceptrón:

una red neuronal que consta de una capa de nodos entre la entrada y la salida es un perceptrón de una sola capa: y una red que consta de varias capas es un perceptrón multicapa:

Es cierto que un perceptrón multicapa es más eficiente que uno monocapa

El entrenamiento es un proceso en el que los parámetros libres de una red neuronal se ajustan simulando el entorno en el que está integrada la red. El tipo de entrenamiento viene determinado por la forma en que se ajustan estos parámetros.

Esta definición del proceso de aprendizaje de una red neuronal supone la siguiente secuencia de eventos:

La red neuronal recibe estímulos del entorno externo.

Como resultado del primer punto, se cambian los parámetros libres de la red neuronal.

Después de cambiar la estructura interna, la red neuronal responde a las excitaciones de otra manera.

La lista anterior de reglas claras para resolver el problema de entrenar una red neuronal se denomina algoritmo de aprendizaje. Es fácil adivinar que no existe un algoritmo de aprendizaje universal adecuado para todas las arquitecturas de redes neuronales. Sólo existe un conjunto de herramientas representadas por una variedad de algoritmos de aprendizaje, cada uno de los cuales tiene sus propias ventajas. Los algoritmos de aprendizaje se diferencian entre sí en la forma en que ajustan los pesos sinápticos de las neuronas. Otra característica distintiva es la forma en que la red neuronal entrenada se comunica con el mundo exterior. En este contexto, hablamos de un paradigma de aprendizaje asociado al modelo del entorno en el que opera una determinada red neuronal.

El entrenamiento supervisado de una red neuronal supone que para cada vector de entrada del conjunto de entrenamiento existe un valor requerido del vector de salida, llamado objetivo. Estos vectores forman un par de entrenamiento. Los pesos de la red se cambian hasta que se obtiene un nivel aceptable de desviación del vector de salida del objetivo para cada vector de entrada.

El aprendizaje no supervisado de una red neuronal es un modelo de aprendizaje mucho más plausible en términos de las raíces biológicas de las redes neuronales artificiales. El conjunto de entrenamiento consta únicamente de vectores de entrada. El algoritmo de entrenamiento de la red neuronal ajusta los pesos de la red para que se obtengan vectores de salida consistentes, es decir de modo que la presentación de vectores de entrada suficientemente cercanos produzca salidas idénticas.

Sea una red neuronal que realice una transformación F:X®Y de vectores X del espacio de características de entradas X en vectores Y del espacio de salida Y. La red está en el estado W desde el espacio de estados W. Entonces, sea una muestra de entrenamiento (Xa,Ya), a = 1 ..p. Considere el error total E cometido por la red en el estado W.

Notemos dos propiedades del error completo. Primero, el error E=E(W) es una función del estado W definido en el espacio de estados. Por definición, toma valores no negativos. En segundo lugar, en algún estado entrenado W*, en el que la red no comete errores en el conjunto de entrenamiento, esta función toma un valor cero. En consecuencia, los estados entrenados son los puntos mínimos de la función introducida E(W).



¿Te gustó el artículo? ¡Compartir con tus amigos!