Si ta kuptojmë inteligjencën artificiale?
Në gjashtë muajt e fundit chatbot-et, si ChatGPT dhe gjeneruesit e imazheve si Midjourney, janë kthyer me shpejtësi në një fenomen kulturor, sipas BBC.Por, modelet e inteligjencës artificiale (IA) ose të mësimit të makinerive kanë ekzistuar prej kohësh.
Në këtë udhëzues fillestar, tregohet rreth chatbot-eve për të parë lloje të ndryshme të IA-së dhe se si ajo tashmë luan një rol në jetën tonë.
Si mëson IA-ja?
Çelësi, për të gjithë mësimin e makinerive, lidhet me një proces të quajtur trajnim, ku një programi kompjuterik i jepet një sasi e madhe të dhënash, ndonjëherë me etiketa që shpjegojnë se çfarë janë të dhënat, dhe një grup udhëzimesh.
Udhëzimi mund të jetë diçka si: “gjeni të gjitha imazhet që përmbajnë fytyra ose kategorizoni këta tinguj”.
Më pas, programi do të kërkojë modele në të dhënat që i janë dhënë për të arritur këto qëllime.
Ajo që programi mëson nga të dhënat, dhe të dhënat që i jepen bëhet modeli i IA-së, dhe materiali i trajnimit përfundon duke përcaktuar aftësitë e tij.
Një mënyrë për të parë se si ky proces trajnimi mund të krijojë lloje të ndryshme të IA-së është të mendosh për kafshë të ndryshme.
Gjatë miliona viteve, mjedisi natyror ka bërë që kafshët të zhvillojnë aftësi specifike, në mënyrë të ngjashme, miliona cikle që një IA bën përmes të dhënave të saj të trajnimit, do të formësojnë mënyrën se si ajo zhvillohet dhe do të çojë në modele të specializuara të IA-së.
Cilët janë disa shembuj, për të parë se si e kemi trajnuar IA-në për të zhvilluar aftësi të ndryshme?
Çfarë janë chatbot-et?
Mendoni sikur një chatbot është një papagall. Është një imitues dhe mund të përsërisë fjalët që ka dëgjuar me njëfarë kuptimi të kontekstit të tyre, por pa një kuptim të plotë të kuptimit të tyre.
Chatbot-et bëjnë të njëjtën gjë, megjithëse në një nivel më të sofistikuar, dhe janë në prag të ndryshimit të marrëdhënies sonë me fjalën e shkruar.
Por, si dinë të shkruajnë chatbot-et?
Ata janë një lloj IA-je e njohur si modele të mëdha gjuhësore (LLM) dhe janë të trajnuar me vëllime të mëdha teksti.
Një LLM është në gjendje të marrë në konsideratë jo vetëm fjalë individuale, por fjali të tëra dhe të krahasojë përdorimin e fjalëve dhe frazave, në një pasazh me shembuj të tjerë në të gjitha të dhënat e tij të trajnimit.
Duke përdorur këto miliarda krahasime midis fjalëve dhe frazave, ai është në gjendje të lexojë një pyetje dhe të gjenerojë një përgjigje, si mesazhet parashikuese me tekst në telefonin tuaj, por në një shkallë masive.
Gjëja e mahnitshme për modelet e mëdha të gjuhëve është se ata mund të mësojnë rregullat e gramatikës dhe të kuptojnë vetë kuptimin e fjalëve, pa ndihmën e njeriut.
A do të ishte e mundur të kombinoheshin disa nga këto aftësi në një model të vetëm hibrid të IA-së?
Kjo është pikërisht një nga progreset më të fundit të IA-së.
Quhet “IA multimodal” dhe lejon një model të shikojë lloje të ndryshme të dhënash, si imazhe, tekst, audio ose video, dhe të zbulojë modele të reja mes tyre.
Kjo qasje multimodale është një nga arsyet për hapin e madh në aftësinë midis ChatGPT3, i cili ishte i trajnuar vetëm me tekst, dhe ChatGPT4, i cili ishte trajnuar edhe me imazhe.
Ideja e një modeli të vetëm të inteligjencës artificiale në gjendje të përpunojë çdo lloj të dhënash, dhe për këtë arsye të kryejë çdo detyrë, nga përkthimi midis gjuhëve deri te dizajnimi i barnave të reja, njihet si inteligjenca e përgjithshme artificiale (AGI).
Për disa, është qëllimi përfundimtar i të gjithë kërkimeve të inteligjencës artificiale; për të tjerët është një rrugë drejt të gjitha atyre distopive fantastiko-shkencore në të cilat ne lëshojmë një inteligjencë aq shumë përtej të kuptuarit tonë, sa nuk jemi më në gjendje ta kontrollojmë atë.