“Mnozí se bojí umělé inteligence především proto,
že ji vidí jako zrcadlo naší duše,
které odhaluje naše vlastní mezilidské a společenské problémy.”
(Max Tegmark – výzkumník v oblasti strojového učení)
Během povídání s různými lidmi jsem mohl názorně vidět, že kolem AI panuje velmi mnoho nedorozumění ohledně toho co to vlastně je AI a jak funguje. První z ních zní – “jen aby do té AI někdo nenaprogramoval něco špatného”.
Dotyční si to představovali zhruba tak, že někdo někde programuje do “AI” všechna možná rozhodnutí a všechny možné reakce na všechno, ale když to bude dělat, tak může naprogramovat i něco “špatně” a nebo i přímo nějaké zlé úmysly. Je to pěkná romantická představa, hodná knihy asi tak z dob Julese Vernea.Toto je totiž “dávná” AI minulost. Toto platilo v 80. a 90. letech 20.století, když se poměrně ve velkém používaly tzv. “expertní systémy”.
Fungovalo to jednoduše a bylo to děsně neefektivní a drahé, ale bylo to to nejlepší, co se s tehdejšími počítači dalo dosáhnout. To jste vzali jednoho nebo několik expertů, začali se jich vyptávat, zapisovali jste co oni říkali a pak jste to zadávali do počítače. A to buď ve formě “když něco tak udělej něco” a nebo jako “pokud A tak něco, pokud B tak něco, pokud C tak něco”… A vznikly tak “decision trees” – “rozhodovací stromy”. Začali jste od problému a přes různá rozhodování jste se dostali k řešení.
Jak asi sami vidíte, tahle “pravěká AI” byla naprosto a zcela závislá na tom, co do ní kdo “naprogramuje”. Záleželo na expertovi, zda se podělí o své znalosti nebo si záměrně nechá něco pro sebe, záleželo na lidech, kteří to kódovali, jak jeho informaci pochopí a záleželo na tom, jestli se někdo nepřeklepne apod. Jeden člověk měl v tomhle prastarém AI modelu opravdu zásadní roli a stejně tak i jedna informace měla mnohem větší váhu. Takže naprosto platilo, že pokud tam nandáte blbosti, vypadnou zase jen blbosti…
Expertní systémy byly prostě jen seznamy otázek a odkazů se kterou další otázkou má program pokračovat na základě odpovědi. Nic víc. Takový systém si nemohl nic “myslet”, protože to byla opravdu jen stromová databáze znalostí. Veškerou interpretaci znalostí dělal vždy člověk. Později se k tomu přidala tak zvaná “fuzzy logika”, takže se nerozhodovalo binárně ano-ne, ale podle “váhy odpovědi”. Tedy “ano” ze 70% na otázku 1 a “ne” ze 60% na otázku 2 nás pošle na “cestu 1”, jiné váhy odpovědí by nás poslaly na jiné cesty.
Expertní systémy byly sice drahé, ale zároveň poměrně hodně úspěšné a na mnoha místech se používají dodnes. A myslím si, že u této jednoduché “pravěké AI” je naprosto jasné, že to jen velmi jednoduché zrcadlo lidských vědomostí a zkušeností. Nic víc.
Jenomže získávání znalostí a vytvoření takového expertního systému bylo obvykle ukrutně časově náročné a proto se řada lidí snažila vyvinout algoritmus, který by se z našeho laického pohledu “dokázal učit sám” z dat, která bude mít k dispozici.
A tím se dostáváme k druhému nedorozumění a zároveň k největšímu strachu “odpůrců AI”. Sotva se začalo více mluvit o ChatGPT, okamžitě se vynořily hlasy, že se nesmí dopustit, aby se AI byla schopna “sama učit”, protože jinak nás rychle předčí. Jenže to bylo tak říkajíc “s křížkem po funuse”, protože všechny moderní AI algoritmy už jsou dávno tak zvaně “samoučící”.
Idea algoritmu “neuronové sítě”, který se dokáže sám “učit”, vznikla už v 50.letech 20.století a prošla postupně různými zdokonaleními, s tím jak přicházel nový a výkonnější hardware. Samoučící algoritmy jsou založené na tom, že z velmi velkých objemů dat dělají velice pokročilé statistiky, aby našly převažující trendy a souvislosti.
Používají se tu výrazy “vektory” a “dimenze” a zní to všechno velice tajuplně, ale všechno je to pořád jen a jen statistika, založená na velkém množství všemožných kritérií. Prostě se spočítají “váhy” jednotlivých dimenzí-kritérií a podle nich je algoritmus schopen stanovit výsledek. Proto možnost ovlivnit takový algoritmus jedním špatným vstupem se mnohem menší, protože statistika nehledí na extrémní hodnoty, ale na průměry a minimální odchylky od průměru.
Protože se se statistickými výpočty a jejich výsledky setkáváme v běžném životě velice často, tak je nám všem myslím docela jasné, že statistika je opravdu jen zrcadlo. Nic víc. Je samozřejmě pravda, že se statistikou se dá dobře čarovat, aneb jak se říkalo za socialismu – existují 3 druhy lži – lež, nehorázná lež a statistika…
Běžnou statistiku také používáme k tomu, abychom se o něčem ponaučili. Velká část naší moderní vědy vlastně stojí na statistice. Aneb jak mi jednou řekl jeden člověk zabývající se jistým výzkumem – my máme v týmu statistika a ten nám vždycky řekne co a jak máme naměřit, aby to všechno dobře vyšlo, takže díky tomu ty výsledky pak vychází “jedna báseň”…
Ať už budeme statistiku nahlížet jakkoliv, nemůžeme popřít, že je to forma učení se a forma poznávání. Je tedy naprosto logické, že “samoučící se” algoritmus je založený na složitých multidimenzionálních statistikách. A tedy, že je to zase jen další zrcadlo lidského světa. Jak to ale funguje, o tom zase v dalších textech…