expertní systémy - úvod

Napsal Mgr.Radovan Kaluža (») 7. 5. 2006 v kategorii IT, internet, přečteno: 2944×

báze znalostí

úschovna všech znalostí experta. Je to jediné místo, kde jsou znalosti ukládány, podléhají určité organizaci, jak bude zřejmé dále. Báze by měla být modulární a otevřená pro zahrnutí nových znalostí a případnou eliminaci znalostí neefektivních či redundantních. Znalosti jsou v podstatě pravidla, kterými se systém řídí.

řídící mechanismus (inferenční mechanismus)

strategie, princip využití znalostí z báze. striktní oddělení znalostí a mechanismu pro jejich použití je typické pro expertní systémy. Právě tato separace umožňuje použití kvalitního již vytvořeného inferenčního mechanismu na jinou bázi znalostí

báze dat

množina všech údajů vztahujících se k danému případu tj. data z báze dat jsou vstupem pro výpočet prováděný inferenčním mechanismem podle pravidel z báze znalostí

nejistota, neurčitost

systém musí být schopen pracovat s neurčitými, nebo nejistými daty jako subjektivní popis potíží pacienta, asi ano, spíše ne, což vyjádříme jako nějakou míru důvěry v její platnost; nejistotu můžeme rozdělit na nejistotu v bázi znalostí tj. pravidla jsou uložena s nějakou váhou, nebo mírou důvěry a na nejistotu v bázi dat, tj. data jsou ohodnocena mírou důvěryhodnosti.

zdůvodnění, vysvětlení

každý systém musí být schopen zdůvodnit a vysvětlit své závěry, nejen pro ověření a pochopení postupu, ale hlavně pokud je konečné rozhodnutí ponecháno uživateli, nebo pokud je výstup určen právě jako pomoc při rozhodování (viz dále)

Druhy exp. systémů:

Existují 2 základní druhy exp. systému tj. diagnostické a plánovací . Jsou to dva různé principy, často ovšem obsažené v jednom expertním systému.

Diagnostické expertní systémy

jsou určeny pro efektivní interpretaci dat s cílem určit, která z hypotéz (hypotézy jsou předem stanoveny) nejlépe koresponduje s aktuálními daty. Nejtypičtější příklad je stanovení diagnózy pacienta na základě jeho subjektivních potíží. tj. máme dány možné řešení a jedno z nich nám systém zvolí. Architektura vypadá takto:

/obrazky/radovan.bloger.cz/exsys-diagnosticke.gif

Báze dat může být složena jednak z uživatelem zadaných hodnot a také z hodnot měřitelných (subjektivní pocit pacienta a jeho naměřená teplota). Aktualizace modelu je provedena vstupem konkrétních dat. Model je velmi často tvořen pouze aktualizací hodnot vah (jistot, subj. pravděpodobností) poznatků, zahrnutých v bázi znalostí. Na počátku jsou hodnoty přiřazeny expertem, po zadání dat jsou v průběhu odvozování tyto hodnoty měněny. Takto je model řešen u systémů MYCIN a PROSPECTOR. Vysvětlovací podsystém je ta část systému, jenž uchovává a vysvětluje postup, jímž bylo dosaženo výsledku.

Plánovací expertní systémy

jsou určeny pro řešení takových úloh, kdy je znám stav počátečního objektu a cíl řešení a systém má s využitím dat a zadání nalézt posloupnost povolených kroků (operátorů), kterou lze cíle dosáhnout. Hledí se také na nalezení pokud možno (z nějakého hlediska) optimální posloupnosti.

/obrazky/radovan.bloger.cz/exsys-planovaci.gif

Hlavní částí plánovacího exp. sys. je generátor možných řešení , jenž vytváří kombinace posloupností operátorů. Toto vytváření je omezováno pravidly z báze znalostí. Dále je testována shoda řešení s daty z báze dat. Výsledkem je seznam přípustných řešení , z nichž každé je ohodnoceno stupněm kvality.
Typickým plánovacím exp. sys. (vyvinut 1965-1969) je DENDRAL, určen k odvozování struktur chem. látek, na základě histogramů z hmotového spektrometru a spektrometru pro jadernou magnetickou rezonanci. Lze jej považovat za první a dodnes využívaný expertní systém.

Hybridní expertní systémy

mají kombinovanou architekturu, tj. kombinují plánovaní a diagnostiku. Příkladem může být inteligentní expertní systém pro výuku, který diagnostikuje znalosti studenta a podle toho plánuje jeho další vzdělávání.

Důležitým nástrojem jsou tzv. prázdné expertní systémy. Jejich idea vychází ze skutečnosti, že základní a zcela univerzální částí expertního systému je jeho inferenční mechanismus. Ten může operovat na bází znalostí, které mají sice společnou architekturu, ale mohou být věcně (problémově) orientovány do různých oblastí. Prázdný expertní systém je tak vybaven řidícím mechanismem a všemi ostatními komponenty, pouze báze znalostí je prázdná. Naplněním báze znalostí expertem se z něj stane expertní systém k podpoře rozhodování v oblasti, na kterou jsou znalosti zaměřeny. Prázdné systémy jsou relativně levné a dostupné, protože to skutečné know-how je právě ve znalostech experta. Plnění prázdných exp. systémů spadá do nové oblasti zvané znalostní inženýrství.

Reprezentace znalostí

je spojena s problémem návrhu a konstrukce báze znalostí a je hlavním problémem efektivity expertního systému. Důležitými požadavky jsou:
  • přirozený charakter reprezentace a její expresivita
  • umožnění aplikace efektivních deduktivních prostředků
  • rychlý přístup k položkám znalostí i dat

Dalším požadavkem je také modularita báze znalostí . Do existující báze je třeba doplňovat nové znalosti, nebo naopak některé odstraňovat, nebo upravovat tj. provádět údržbu. Modularita přináší výhody v organizaci – změny jsou lokální a nepromítají se do ostatních částí báze. Její nevýhoda je větší složitost prohledávání, protože údaje o jednom objektu nemusí být soustředěny na jednom místě, tj. nemusí zohledňovat sémantiku báze.
Sémantické sdružování znalostí pak vyplývá především z požadavku na rychlost vybavování znalostí. V praxi se musí volit rozumný kompromis.
Znalosti pak lze reprezentovat buďto deklarativně, nebo procedurálně. Deklarativně reprezentované znalosti se nazývají poznatky které vyjadřují, co má být poznáno nebo dokázáno:
Železo je kov Tatáž znalost reprezentována procedurálně, má podobu podmíněného pravidla typu IF-THEN:
JESTLIŽE (X je železo) PAK (X je kov).
Lze vidět, že jednu a tutéž znalost lze formalizovat jak deklarativně, tak i procedurálně.

Řídící mechanismus

Řídící (inferenční, odvozovací) mechanismus zabezpečuje v expertním systému využívání znalostí. Při návrhu těchto mechanismů se obvykle vychází z pojmů i výsledků obecné teorie řešení úloh, především z úlohy prohledávání stavového prostoru (prostoru řešení). Často jsou zahrnovány další častokrát i jen specifické, neobecné (ad-hoc) principy a techniky řízení. Ke konstrukci mechanismů se využívá i technik, které z řešení úloh bezprostředně nevycházejí:

Technika agendy – v průběhu řešení se jako vedlejší produkt vytváří hierarchický zásobník úkolů, které by měly být postupně řešeny. Po vyřešení prvního dílčího úkolu se přistupuje k řešení úkolu dalšího – ležícího na vrcholu zásobníku. Tento princip je považován za prostředek efektivního zaostřování pozornosti.
Technika démonů – démony jsou programy, jenž sledují průběh inferenčního procesu a zasáhnou v případě předem přesně specifikované situace. V každém kroku inference musí být testováno, zda situace pro spuštění některého z nich nenastala.
Technika nemonotónní inference . Inferenční proces probíhá v situaci, kdy je uvažována celá řada předpokladů a podmínek. V reálné situaci nemusí být některé z nich splněny a pak je nezbytné, aby řídicí mechanizmy byly vybaveny procedurami pro korektní úpravy aktuálního modelu po nesplnění původních předpokladů v průběhu řešení úlohy.
Technika černé tabule. Znalostní báze je v tomto případě rozdělena na několik podbází, z nichž každá obsahuje znalosti z určité podoblasti řešené problematiky (znalostní zdroje). Komunikace mezi těmito dílčími bázemi je řízena speciální společně sdílenou datovou a řídicí strukturou, zvanou černá tabule. Systém využívající techniky černé tabule simuluje řešení problému panelovou diskuzí mezi odborníky několika souvisejících oborů.
Technika taxonomie . Při použití této techniky je využito speciální formy odvozování tzv. děděním v taxonomické struktuře dílčích konceptů. Taxonomické struktury jsou určitou doplňkovou formou reprezentace znalostí a jsou využívány k zaostřování pozornosti v jednotlivých znalostních bázích. Úplné potvrzení některé položky v taxonomii v průběhu inference může mít za následek zamítnutí jiných položek na stejné taxonomické úrovni a jejich vyloučení z dalšího vyšetřování (ořezávání stavového prostoru).

Inferenční mechanismy pracují v jednotlivých krocích inference, které na sebe navazují. Posloupnost inferencí se nazývá řetězec. K dosažení cíle lze použít dvě různé strategie – dopředné řetězení (od faktům k závěru) a zpětné řetězení (od hypotéz k faktům). Dopředné řetězení se uživá v plánování, monitorování a řízení. Z faktů se odvozuje budoucnost. Je též nazýván „zdola nahoru“. Zpětné řetězení se také nazývá „shora dolů“.

Zpracování neurčité informace

Neurčitost v systému má mnohé příčiny. Ať už je to nepřesnost měřících přístrojů, nebo vágní jazyková formulace, nebo subjektivní dojem, se všemi je potřeba pracovat. Právě zpracování neurčitosti, je jedna z nejpodstatnějších složek expertních systémů.
Nejistota, neurčitost býva v expertních systémech vyjadřována různými způsoby:
- mohou to být různé váhy, míry, stupně důvěry aj. nazývané a formulované subjektivní pravděpobností. Tyto numerické parametry jsou přiřazeny jednotlivým tvrzením, pravidlům a datům. Číselný interval těchto parametrů je obvykle nebo (viz MYCIN, PROSPECTOR). Nástrojem v těchto podmínkách je matematická pravděpodobnost.
- je-li k reprezentaci využito přirozeného jazyka, pak je neurčitost dána stupněm vágnosti použitých jazykových těrmů (velmi vysoký, asi ano atd.). K formalizaci vágních pojmů se využívá fuzzy množinové matematiky, inferenční mechanismy pak využívají principů fuzzy jazykové logiky.
-
Neurčitost lze také rozdělit na neurčitost v bázi znalostí a neurčitost v bázi dat. Je zřejmé, že oba druhy neurčitosti spolu souvisí. Jestliže pravidlo odvozuje z předpokladů závěr poznamenaný neurčitostí a ten se následně ukládá do báze dat, tak v bázi dat musí být tato neurčitost zohledněna. Důsledek pravidla totiž může být předpokladem pravidla dalšího a tak může docházet k šíření neurčitosti v posloupnosti interpretace pravidel. V tomto smyslu mluvíme o aproximativní inferenci (vyvozování).

Neurčitost vyjádřená pravděpodobností, využívá především podmíněnou pravděpodobnost a Bayesovu větu. Pojem podmíněné pravděpodobnosti
/obrazky/radovan.bloger.cz/exsys-podminena.gif
vyjadřuje pravděpodobnost realizace jevu A, za přepokladu, že nastal jev B.

Facebook Twitter Linkuj.cz

Komentáře

Totem z IP 90.176.210.*** | 2.1.2008 12:13
Pěkný článek, díky
Ja z IP 147.32.118.*** | 8.1.2008 10:10
Suhlas , vdaka autorovi
Vlk23 z IP 85.70.110.*** | 11.1.2008 10:09
Musím souhlasit, super článek. smile
Katka z IP 2001:718:1e02:*** | 7.6.2012 15:25
Tak tak, párkrát už jsem sem zabrousila při hledání "normálního" vysvětlení pojmů ke zkouškám. Konečně někdo, kdo to dokáže vysvětlit lidsky. Díky moc!!! smile


Nový komentář

Téma:
Jméno:
Notif. e-mail *:
Komentář:
[*1*] [*2*] [*3*] [*4*] [*5*] [*6*] [*7*] [*8*] [*9*] [*10*] [*11*] [*12*] [*13*] [*14*] [*15*] [*16*] [*17*] [*18*] [*19*] [*20*] [*21*] [*22*] [*23*] [*24*] [*25*] [*26*] [*27*] [*28*] [*29*] [*30*] [*31*] [*32*] [*33*] [*34*] [*35*] [*36*] [*37*] [*38*] [*39*] [*40*] [*41*] [*42*] [*43*] [*44*] [*45*] [*46*] [*47*] [*48*] [*49*] [*50*]   [b] [obr]
Odpovězte prosím číslicemi: Součet čísel šest a šest