Umetna inteligenca (AI) v zadnjih nekaj letih napreduje z neverjetno hitrostjo. Povečanje števila transformerjev je pripeljalo do izjemnih zmogljivosti na področju jezika (npr. GPT-3, PaLM, Chinchilla), kode (npr. Codex, AlphaCode) in ustvarjanja slik (npr. DALL-E, Imagen) in leto 2022 je nedvomno prelomnica, ko so različni modeli, tako zasebni kot odprtokodni, stopili v bolj mainstream okolje. Trenutno je med najbolj priljubljenimi nedvomno ChatGPT. 

GPT-3

Leta 2020 je bil predstavljen GPT-3, ki je danes eden vodilnih LLM – velikih jezikovnih modelov (large language models). Sposoben se je učiti iz zapisanega besedila in nato ustvariti pogovor, njegovo delovanje pa je tako izpopolnjeno in natančno, da ga lahko uporabljamo tudi za komercialne aplikacije. GPT-3 na področju prevajanja zapisa zvoka v besedilo uporabljajo tudi taki velikani, kot sta Google in Meta. Do danes je GPT-3 postal običajna praksa na različnih področjih, pridobite pa lahko tudi svojim potrebam prilagojen GPT-3 in ga uporabite za različne naloge, kot so prevajanje, sinteza govora, prepoznavanje slik in podobno.

Konkurenca modelu GPT-3 so modeli PaLM, Chinchilla, GLaM, Megatron-Turning NLG, Gopher in LaMDA. PaLM je model širšega spektra, ki je prvi presegel mejo 540 milijard parametrov (nastavljive vrednosti nevronske mreže, ki omogočajo učenje). To mu poleg razumevanja besedila, prepoznavanja konteksta in sintetiziranja novega modela omogoča tudi, da ustvarja zaključke besedil, piše programsko kodo, odgovarja na vprašanja, avtomatsko prepoznava vzorce, razume logiko in jo replicira. V letu 2022 se je PaLM na primerjalnem testu NLP (natural language processing) uvrstil v sam vrh, saj je izvedel 28 od 29 zastavljenih nalog. Matematične besedilne naloge, primerne za otroke v starosti od 9 do 12 let, je rešil s 60-odstotno uspešnostjo.

Ko računalnik sam ustvari sliko 

V letu 2022 se je pojavilo več novih modelov, ki zmorejo iz uporabnikovega besedila ustvariti računalniško fotografijo. Eden prvih tovrstnih modelov je bil DALL-E, ki je močno povezan z GPT-3. Difuzijski modeli predstavljajo nov razred najsodobnejših generativnih modelov, ki ustvarjajo raznolike slike visoke ločljivosti. Primeri arhitektur, ki temeljijo na difuzijskih modelih, so GLIDE, DALLE-2, Imagen in popolnoma odprtokodni model Stable Diffusion. Modeli so sposobni generiranja besedila z vnaprej določeno strukturo ali semantičnim kontekstom (npr. roman), generiranja videoposnetkov in celo generiranja molekul.

Nekaj zanimivih in testiranja vrednih modelov, ki generirajo slike iz besedila, so: DALLE-2, Imagen, Parti ter dva, ki nista iz skupine velikanov AI-modelov: Stability.ai in Midjourney. Prvi zametki generiranja videov iz besedila so že dostopni v raziskovalne namene, rezultati pa so odlični. Ob vsem tem se postavlja vprašanje, ali bomo čez nekaj let sploh še potrebovali Shutterstock in podobne storitve.

Kaj pa poslovno bolj uporabni AI-modeli?

Zgoraj našteti modeli kažejo na hiter razvoj AI in sposobnost generiranja delov besedila, kode ali slik, uporabnike pa bolj zanimajo modeli, ki jim lahko pomagajo pri vsakodnevnih nalogah v digitalnem sistemu, kot so vnos besedila in slik v CRM, ERP ali spletno trgovino. Eden trenutno najboljših modelov je ACT-1 podjetja Adapt, ki razume informacije, vnesene v vnosna polja, pozna njihov pomen in jih zna uporabljati oziroma slediti ukazom. Na ta način samodejno opravi neko aktivnost in, če povemo na preprost način, omogoča uporabniku, da mu ni več treba klikati po CRM-ju (recimo vnos nove stranke v CRM in pridobivanje podatkov o stranki iz različnih spletnih virov brez uporabe API-integracij, napredna uporaba Excelovih funkcij, izračun učinkovitost A/B-testiranja in podobno). Model ACT-1 je trenutno še v beta različici in še ni splošno na voljo. Obstaja pa nekaj drugih modelov, s katerimi je mogoče doseči podoben učinek. Za avtomatizacijo opravil brez dejanskega pisanja kode (čeprav boste še vedno morali napisati nekaj pravil) lahko uporabimo orodja RPA ali strojnega učenja, kot sta Google Cloud AutoML in IBM Watson Automated Insights.

V to kategorijo orodij velja umestiti tudi modele in orodja, ki pomagajo pri programiranju, kot sta Codex in AlphaCode, ki znata del kode napisati na podlagi uporabniškega opisa funkcionalnosti.

ChatGPT

Konec novembra je podjetje Open AI objavilo testno verzijo klepetalnega robota ChatGPT, predvideno predvsem za raziskovalne namene. Gre za konverzacijski AI, ki se zna odzivati na uporabnikova vprašanja in odgovarja v kontekstu pogovora. Zmožen je pravega pogovora, saj si zapomni tudi prejšnja vprašanja in svoje odgovore, na katera se smiselno navezuje in jih povezuje ter oblikuje nove odgovore. Zanimivo je, da je v zgolj petih dneh dosegel milijon uporabnikov, kar je rekord med aplikacijami in rešitvami. Za primerjavo – iPhone je do milijona uporabnikov prišel v 74 dneh, Instagram v dveh mesecih in pol, Netflix pa je potreboval tri leta in pol. Poglejmo, kaj o ChatGPT-ju zapiše AI: “ChatGPT je AI-model, ki je bil ustvarjen za uporabo v klepetalnicah in za klepet z ljudmi. Je nadgradnja AI-modela GPT-3, ki je bil prvotno razvit za avtomatizacijo pisanja besedil in je postal eden najbolj znanih AI-modelov. ChatGPT je bil posebej prilagojen za uporabo v klepetalnicah in je zmožen odgovarjati na vprašanja ter izmenjavo besedil z ljudmi na način, ki je podoben človeškemu klepetu. Model je bil oblikovan tako, da lahko razume kontekst in se prilagaja različnim pogovornim okoljem.”

Izzivi modelov AI in predvidevanja

Največji izziv, ki ga mnogi izpostavljajo, je etičnost uporabe teh modelov v praksi. Nekateri trdijo, da jih ne bi smeli uporabljati, ker so pristranski in ker so bili za usposabljanje modela uporabljeni podatki, ki so jih ustvarili uporabniki, torej imajo nad njimi tudi stvarne pravice. Dodaten izziv predstavlja pomanjkanje jasnosti glede tega, kako pravzaprav modeli umetne inteligence delujejo in česa vsega so zmožni. Umetna inteligenca med ljudmi še vedno povzroča precej razburjenja, a sčasoma bodo tako kot pri drugih sodobnih tehnologijah ljudje razumeli njeno delovanje ter prepoznali koristi, ki jim jih lahko prinese.

Trendi, ki jih napovedujejo strokovnjaki za AI: 

  • AGI (Artificial General Intelligence) je eden glavnih ciljev mnogih raziskav na področju umetne inteligence ter pogosta tema znanstvene fantastike in študij prihodnosti. AGI imenujemo tudi močna umetna inteligenca, popolna umetna inteligenca ali splošno inteligentno delovanje, čeprav nekateri akademski viri izraz močna umetna inteligenca uporabljajo za računalniške programe, ki imajo občutek ali zavest. AGI se od ozke umetne inteligence razlikuje v tem, da predstavlja bolj splošno, človeku podobno sposobnost reševanja problemov. To je podobno razliki med človekom, ki je dober v algebri, in človekom, ki se lahko nauči katerega koli novega predmeta v šoli.

  • Do septembra 2023 se bo več kot 100.000 razvijalcev ukvarjalo z modelom za generiranje zvoka. Generativna zvočna orodja temeljijo na tehnikah globokega učenja, torej se učijo iz primerov in nato sama ustvarjajo nove zvoke ali glasbo. Orodja lahko ustvarijo zvok na podlagi začetnega vnosa uporabnika ali podatkovne zbirke z že obstoječimi zvoki. To se razlikuje od običajnih orodij za ustvarjanje glasbe, ki običajno zahtevajo človeški vnos z glasbenimi instrumenti ali računalniškimi tipkovnicami. 

  • Varnost  in etična uporaba umetne inteligence (AI): Za etično uporabo umetne inteligence se zavzema iniciativa EGAI (Ethics and Governance of AI Initiative), ki jo soustvarjajo MIT Media Lab, Univerza Harvard in Berkman Klein Center for Internet & Society na Univerzi Harvard.

Vpliv AI na CX?

Ali bo umetna inteligenca vplivala na vaš odnos s strankami in izkušnjo stranke? Odgovor je da, vendar ta vpliv v bližnji prihodnosti ne bo opazen v taki meri, kot si predstavljamo danes. V nekoliko oddaljenejši prihodnosti pa bo veliko večji, kot si zmoremo zamisliti. Kot pravi Yuval Noah Harari, bo Homo sapiens, kot smo ga poznali, v prihodnosti dobil vrstnike v obliki umetnih entitet ali kot je zapisal sam: “Smo ena od zadnjih generacij Homo sapiensa. V sto ali dvesto letih bodo na Zemlji prevladovala bitja, ki se bodo bolj razlikovala od nas, kot se mi razlikujemo od šimpanzov.”

O napredku ter vplivu AI na življenje in prihodnost presodite sami, vsekakor pa ne pričakujte, da vam bo že leta 2023 v vaši najljubši kavarni postregel robot, ki bo natančno poznal vaš okus za kavo in znal izbrati vljudnostno frazo, primerno vašemu trenutnemu razpoloženju … Morda pa se to zgodi leta 2032, kdo ve?

*25 % članka je napisala umetna inteligenca. Lahko ugotoviš, katerih 25?